Bagaimana layar pertama yang Anda lihat ditentukan? Kisah rekomendasi personalisasi banner beranda Musinsa

(medium.com)

2 poin oleh GN⁺ 2025-06-05 | 1 komentar | Bagikan ke WhatsApp

Banner beranda adalah area inti yang pertama kali terlihat di layar awal pelanggan, dan memaksimalkan click-through rate (CTR) serta pengalaman pengguna melalui sistem rekomendasi hiperpersonalisasi
Beranjak dari pendekatan optimasi CTR sederhana berbasis MAB (multi-armed bandit), sistem ini secara presisi merefleksikan karakteristik banner dan pengguna dengan algoritme terbaru seperti DeepFM, Two-Tower, dan HGNN serta embedding berbasis graf
Masalah khas domain seperti siklus hidup banner yang pendek, feedback klik yang penuh noise, dan ketidakseimbangan data diatasi dengan Continual Learning, serta pengoperasian campuran model individual dan model terintegrasi
Hasil akhirnya, sistem membangun pipeline rekomendasi yang terstruktur dengan peningkatan CTR lebih dari 16%, penanganan banner baru dan cold user, serta integrasi real-time dan kebijakan bisnis
Ke depan, sistem akan terus berkembang melalui serving real-time, Multi-Task Learning, peningkatan kualitas embedding, dan penerapan metrik kinerja yang lebih beragam

Menciptakan pengalaman yang lebih baik dengan big banner yang disesuaikan untuk pelanggan

Seiring meningkatnya preferensi pelanggan dan keragaman konten yang ditampilkan, penayangan banner yang seragam memiliki keterbatasan dalam memberikan pengalaman yang memuaskan
Dengan tujuan memaksimalkan CTR, tim menjalankan proyek untuk menerapkan logika penayangan personal pada big banner di bagian atas beranda tiap store

Pentingnya dan karakteristik banner beranda

Banner beranda adalah banner tipe slide di bagian paling atas layar yang pertama kali dilihat pelanggan di layanan Musinsa (total 35 banner); di aplikasi ditampilkan satu banner, di web tiga banner
Sekitar 97% dari seluruh traffic Musinsa melihat banner beranda saat masuk ke layar utama
Klik pada banner beranda mencakup 35% dari total jumlah klik, dan 37% dari sesi yang menghasilkan klik, menunjukkan bobotnya yang besar
Ini adalah area dengan frekuensi tayang tinggi dan dampak konversi bisnis yang sangat besar

Keterbatasan metode rekomendasi sebelumnya

Sebelumnya, rekomendasi dilakukan dengan memanfaatkan algoritme MAB (Multi-Armed Bandit) yang berfokus pada CTR
- Menyeimbangkan exploration dan exploitation
Tiga keterbatasan:
- Ketergantungan pada satu metrik CTR sehingga kurang mampu merefleksikan beragam preferensi pelanggan dan karakteristik banner
- Sulit merefleksikan keterkaitan antar-banner (diproses secara independen)
- Cold start (penurunan performa saat data klik untuk banner baru masih kurang)
Untuk mengatasi keterbatasan ini, tim merancang sistem rekomendasi baru

Pipeline sistem rekomendasi

Sistem disusun sebagai pipeline multi-tahap
1. Memperkuat representasi banner: mengekstrak embedding berbasis teks, gambar, dan produk terkait banner (menggunakan HGNN dan GraphSAGE)
2. Melatih model prediksi klik: menerapkan model DeepFM (interaksi fitur) dan Two-Tower (embedding pengguna/banner terpisah) secara bersamaan
3. Scoring dan penerapan banner: menghitung skor prediksi CTR per pengguna secara batch/real-time
  - Untuk pengguna dengan data yang cukup, diterapkan personalisasi yang presisi
  - Untuk pengguna baru atau cold user, digunakan rekomendasi berbasis segmen
4. Merefleksikan kebijakan bisnis: selain skor sistem, kebijakan dan strategi perusahaan, banner kampanye, serta perubahan darurat juga direfleksikan secara real-time
5. Penayangan banner final: merekomendasikan dan menampilkan banner Top-N dengan skor tertinggi

Pengenalan model inti rekomendasi

DeepFM: struktur paralel FM (interaksi orde-2) + DNN (interaksi berdimensi tinggi) yang efektif mempelajari data sparse dan interaksi kompleks, sangat unggul untuk prediksi CTR
Two-Tower: mengekstrak embedding pengguna dan banner dari jaringan saraf yang independen, unggul pada data berskala besar dan serving real-time, serta cocok untuk rekomendasi berbasis kemiripan

DeepFM

Menggabungkan layer FM (interaksi fitur orde-2) + layer DNN (integrasi fitur nonlinier berdimensi tinggi)
Kuat terhadap data sparse, dan mengoptimalkan performa secara konsisten lewat struktur pembelajaran end-to-end
Menggunakan informasi pengguna, metadata banner, dan informasi embedding (64 dimensi) sebagai fitur
Vektor embedding diproses sebagai satu blok tunggal untuk memastikan efisiensi dan stabilitas pembelajaran
Hasil prediksi CTR digunakan untuk menghasilkan peringkat banner

Two-Tower

Menghasilkan embedding pengguna dan banner di jaringan saraf terpisah (tower), lalu menghitung kemiripan
Memungkinkan skalabilitas untuk data skala besar, serta respons cepat dengan vektorisasi sebelumnya (latensi rendah)
Tiap tower memanfaatkan beragam input seperti demografi, log perilaku, teks/gambar, dan lainnya
Struktur pemisahan pembelajaran/pemrosesan paralel memungkinkan penanganan masalah rekomendasi skala besar secara cepat dan fleksibel

Tantangan utama saat diterapkan di lingkungan produksi

Banner beranda memiliki siklus hidup yang sangat pendek (2–3 hari, bahkan bisa per jam), sehingga membutuhkan refleksi real-time
Sinyal feedback terutama bergantung pada klik, sehingga sulit membedakan preferensi pengguna yang sebenarnya
Tidak seperti produk atau brand, banner kekurangan metadata yang terstruktur, sehingga konteks gambar dan teks sulit dipahami
Ketidakseimbangan data per store (perbedaan traffic dan aktivitas antar-kategori store) dapat menurunkan performa keseluruhan
Untuk mengatasi masalah ini, sistem didesain ulang dengan tiga sumbu teknis utama: memperkuat daya representasi, menjaga kebaruan, dan mengurangi ketidakseimbangan

Langkah perbaikan yang nyata

Memperkuat karakteristik banner

Untuk mengatasi keterbatasan penggunaan rata-rata embedding PinSAGE (keterbatasan dalam merepresentasikan banner kompleks dan ketidakmampuan merekomendasikan banner baru), tim mengadopsi HGNN
Berdasarkan pola perilaku pengguna, hubungan banner-produk di dalam struktur graf di-embedding dengan GraphSAGE
Untuk informasi teks dan gambar, digunakan kombinasi embedding LLM
Diterapkan pembaruan embedding pengguna secara real-time serta Continual Learning untuk merefleksikan minat pengguna terbaru
CTR naik 8,3%

Continual Learning

Beranjak dari pembelajaran batch pada seluruh data, diperkenalkan pembaruan berkelanjutan (per 1 jam, menggunakan log 3 jam terbaru)
Learning rate disesuaikan secara dinamis menurut volume aktivitas (maksimum 5x per minggu, 2x pada malam hari)
Mewujudkan adaptasi cepat dan pencegahan penuaan model, serta refleksi rekomendasi yang cepat tanpa penurunan performa
CTR naik 24%

Pemilihan model yang strategis

Menetapkan strategi pemodelan optimal untuk tiap store
Main store menggunakan DeepFM+Continual, sedangkan kategori store khusus memakai model individual Two-Tower, dengan peningkatan CTR 19%

Hasil akhir

Dibandingkan MAB sebelumnya, Two-Tower meningkatkan CTR 11,2% dan DeepFM 16,1%
Pada praktiknya, beranda Musinsa menerapkan DeepFM+Continual Learning, sementara kategori store khusus menggunakan model Two-Tower

Arah selanjutnya

Akan terus didorong pengembangan seperti transisi ke arsitektur serving real-time, penerapan Multi-Task Learning (CTR+GGMV), peningkatan kualitas embedding dan struktur graf, serta diversifikasi metrik kinerja
Ada rencana mengembangkan model yang melampaui CTR tunggal menjadi model yang juga mengevaluasi pencapaian berbagai tujuan bisnis dan pengalaman berkualitas

1 komentar

codemasterkimc 2025-06-05

Tulisan yang bagus ~

Bagaimana layar pertama yang Anda lihat ditentukan? Kisah rekomendasi personalisasi banner beranda Musinsa

Menciptakan pengalaman yang lebih baik dengan big banner yang disesuaikan untuk pelanggan

Pentingnya dan karakteristik banner beranda

Keterbatasan metode rekomendasi sebelumnya

Pipeline sistem rekomendasi

Pengenalan model inti rekomendasi

DeepFM

Two-Tower

Tantangan utama saat diterapkan di lingkungan produksi

Langkah perbaikan yang nyata

Memperkuat karakteristik banner

Continual Learning

Pemilihan model yang strategis

Hasil akhir

Arah selanjutnya

Bacaan terkait

1 komentar