- Banner beranda adalah area inti yang pertama kali terlihat di layar awal pelanggan, dan memaksimalkan click-through rate (CTR) serta pengalaman pengguna melalui sistem rekomendasi hiperpersonalisasi
- Beranjak dari pendekatan optimasi CTR sederhana berbasis MAB (multi-armed bandit), sistem ini secara presisi merefleksikan karakteristik banner dan pengguna dengan algoritme terbaru seperti DeepFM, Two-Tower, dan HGNN serta embedding berbasis graf
- Masalah khas domain seperti siklus hidup banner yang pendek, feedback klik yang penuh noise, dan ketidakseimbangan data diatasi dengan Continual Learning, serta pengoperasian campuran model individual dan model terintegrasi
- Hasil akhirnya, sistem membangun pipeline rekomendasi yang terstruktur dengan peningkatan CTR lebih dari 16%, penanganan banner baru dan cold user, serta integrasi real-time dan kebijakan bisnis
- Ke depan, sistem akan terus berkembang melalui serving real-time, Multi-Task Learning, peningkatan kualitas embedding, dan penerapan metrik kinerja yang lebih beragam
Menciptakan pengalaman yang lebih baik dengan big banner yang disesuaikan untuk pelanggan
- Seiring meningkatnya preferensi pelanggan dan keragaman konten yang ditampilkan, penayangan banner yang seragam memiliki keterbatasan dalam memberikan pengalaman yang memuaskan
- Dengan tujuan memaksimalkan CTR, tim menjalankan proyek untuk menerapkan logika penayangan personal pada big banner di bagian atas beranda tiap store
Pentingnya dan karakteristik banner beranda
- Banner beranda adalah banner tipe slide di bagian paling atas layar yang pertama kali dilihat pelanggan di layanan Musinsa (total 35 banner); di aplikasi ditampilkan satu banner, di web tiga banner
- Sekitar 97% dari seluruh traffic Musinsa melihat banner beranda saat masuk ke layar utama
- Klik pada banner beranda mencakup 35% dari total jumlah klik, dan 37% dari sesi yang menghasilkan klik, menunjukkan bobotnya yang besar
- Ini adalah area dengan frekuensi tayang tinggi dan dampak konversi bisnis yang sangat besar
Keterbatasan metode rekomendasi sebelumnya
- Sebelumnya, rekomendasi dilakukan dengan memanfaatkan algoritme MAB (Multi-Armed Bandit) yang berfokus pada CTR
- Menyeimbangkan exploration dan exploitation
- Tiga keterbatasan:
- Ketergantungan pada satu metrik CTR sehingga kurang mampu merefleksikan beragam preferensi pelanggan dan karakteristik banner
- Sulit merefleksikan keterkaitan antar-banner (diproses secara independen)
- Cold start (penurunan performa saat data klik untuk banner baru masih kurang)
- Untuk mengatasi keterbatasan ini, tim merancang sistem rekomendasi baru
Pipeline sistem rekomendasi
- Sistem disusun sebagai pipeline multi-tahap
- Memperkuat representasi banner: mengekstrak embedding berbasis teks, gambar, dan produk terkait banner (menggunakan HGNN dan GraphSAGE)
- Melatih model prediksi klik: menerapkan model DeepFM (interaksi fitur) dan Two-Tower (embedding pengguna/banner terpisah) secara bersamaan
- Scoring dan penerapan banner: menghitung skor prediksi CTR per pengguna secara batch/real-time
- Untuk pengguna dengan data yang cukup, diterapkan personalisasi yang presisi
- Untuk pengguna baru atau cold user, digunakan rekomendasi berbasis segmen
- Merefleksikan kebijakan bisnis: selain skor sistem, kebijakan dan strategi perusahaan, banner kampanye, serta perubahan darurat juga direfleksikan secara real-time
- Penayangan banner final: merekomendasikan dan menampilkan banner Top-N dengan skor tertinggi
Pengenalan model inti rekomendasi
- DeepFM: struktur paralel FM (interaksi orde-2) + DNN (interaksi berdimensi tinggi) yang efektif mempelajari data sparse dan interaksi kompleks, sangat unggul untuk prediksi CTR
- Two-Tower: mengekstrak embedding pengguna dan banner dari jaringan saraf yang independen, unggul pada data berskala besar dan serving real-time, serta cocok untuk rekomendasi berbasis kemiripan
DeepFM
- Menggabungkan layer FM (interaksi fitur orde-2) + layer DNN (integrasi fitur nonlinier berdimensi tinggi)
- Kuat terhadap data sparse, dan mengoptimalkan performa secara konsisten lewat struktur pembelajaran end-to-end
- Menggunakan informasi pengguna, metadata banner, dan informasi embedding (64 dimensi) sebagai fitur
- Vektor embedding diproses sebagai satu blok tunggal untuk memastikan efisiensi dan stabilitas pembelajaran
- Hasil prediksi CTR digunakan untuk menghasilkan peringkat banner
Two-Tower
- Menghasilkan embedding pengguna dan banner di jaringan saraf terpisah (tower), lalu menghitung kemiripan
- Memungkinkan skalabilitas untuk data skala besar, serta respons cepat dengan vektorisasi sebelumnya (latensi rendah)
- Tiap tower memanfaatkan beragam input seperti demografi, log perilaku, teks/gambar, dan lainnya
- Struktur pemisahan pembelajaran/pemrosesan paralel memungkinkan penanganan masalah rekomendasi skala besar secara cepat dan fleksibel
Tantangan utama saat diterapkan di lingkungan produksi
- Banner beranda memiliki siklus hidup yang sangat pendek (2–3 hari, bahkan bisa per jam), sehingga membutuhkan refleksi real-time
- Sinyal feedback terutama bergantung pada klik, sehingga sulit membedakan preferensi pengguna yang sebenarnya
- Tidak seperti produk atau brand, banner kekurangan metadata yang terstruktur, sehingga konteks gambar dan teks sulit dipahami
- Ketidakseimbangan data per store (perbedaan traffic dan aktivitas antar-kategori store) dapat menurunkan performa keseluruhan
- Untuk mengatasi masalah ini, sistem didesain ulang dengan tiga sumbu teknis utama: memperkuat daya representasi, menjaga kebaruan, dan mengurangi ketidakseimbangan
Langkah perbaikan yang nyata
Memperkuat karakteristik banner
- Untuk mengatasi keterbatasan penggunaan rata-rata embedding PinSAGE (keterbatasan dalam merepresentasikan banner kompleks dan ketidakmampuan merekomendasikan banner baru), tim mengadopsi HGNN
- Berdasarkan pola perilaku pengguna, hubungan banner-produk di dalam struktur graf di-embedding dengan GraphSAGE
- Untuk informasi teks dan gambar, digunakan kombinasi embedding LLM
- Diterapkan pembaruan embedding pengguna secara real-time serta Continual Learning untuk merefleksikan minat pengguna terbaru
- CTR naik 8,3%
Continual Learning
- Beranjak dari pembelajaran batch pada seluruh data, diperkenalkan pembaruan berkelanjutan (per 1 jam, menggunakan log 3 jam terbaru)
- Learning rate disesuaikan secara dinamis menurut volume aktivitas (maksimum 5x per minggu, 2x pada malam hari)
- Mewujudkan adaptasi cepat dan pencegahan penuaan model, serta refleksi rekomendasi yang cepat tanpa penurunan performa
- CTR naik 24%
Pemilihan model yang strategis
- Menetapkan strategi pemodelan optimal untuk tiap store
- Main store menggunakan DeepFM+Continual, sedangkan kategori store khusus memakai model individual Two-Tower, dengan peningkatan CTR 19%
Hasil akhir
- Dibandingkan MAB sebelumnya, Two-Tower meningkatkan CTR 11,2% dan DeepFM 16,1%
- Pada praktiknya, beranda Musinsa menerapkan DeepFM+Continual Learning, sementara kategori store khusus menggunakan model Two-Tower
Arah selanjutnya
- Akan terus didorong pengembangan seperti transisi ke arsitektur serving real-time, penerapan Multi-Task Learning (CTR+GGMV), peningkatan kualitas embedding dan struktur graf, serta diversifikasi metrik kinerja
- Ada rencana mengembangkan model yang melampaui CTR tunggal menjadi model yang juga mengevaluasi pencapaian berbagai tujuan bisnis dan pengalaman berkualitas
1 komentar
Tulisan yang bagus ~