2 poin oleh GN⁺ 2025-06-05 | 1 komentar | Bagikan ke WhatsApp
  • Banner beranda adalah area inti yang pertama kali terlihat di layar awal pelanggan, dan memaksimalkan click-through rate (CTR) serta pengalaman pengguna melalui sistem rekomendasi hiperpersonalisasi
  • Beranjak dari pendekatan optimasi CTR sederhana berbasis MAB (multi-armed bandit), sistem ini secara presisi merefleksikan karakteristik banner dan pengguna dengan algoritme terbaru seperti DeepFM, Two-Tower, dan HGNN serta embedding berbasis graf
  • Masalah khas domain seperti siklus hidup banner yang pendek, feedback klik yang penuh noise, dan ketidakseimbangan data diatasi dengan Continual Learning, serta pengoperasian campuran model individual dan model terintegrasi
  • Hasil akhirnya, sistem membangun pipeline rekomendasi yang terstruktur dengan peningkatan CTR lebih dari 16%, penanganan banner baru dan cold user, serta integrasi real-time dan kebijakan bisnis
  • Ke depan, sistem akan terus berkembang melalui serving real-time, Multi-Task Learning, peningkatan kualitas embedding, dan penerapan metrik kinerja yang lebih beragam

Menciptakan pengalaman yang lebih baik dengan big banner yang disesuaikan untuk pelanggan

  • Seiring meningkatnya preferensi pelanggan dan keragaman konten yang ditampilkan, penayangan banner yang seragam memiliki keterbatasan dalam memberikan pengalaman yang memuaskan
  • Dengan tujuan memaksimalkan CTR, tim menjalankan proyek untuk menerapkan logika penayangan personal pada big banner di bagian atas beranda tiap store

Pentingnya dan karakteristik banner beranda

  • Banner beranda adalah banner tipe slide di bagian paling atas layar yang pertama kali dilihat pelanggan di layanan Musinsa (total 35 banner); di aplikasi ditampilkan satu banner, di web tiga banner
  • Sekitar 97% dari seluruh traffic Musinsa melihat banner beranda saat masuk ke layar utama
  • Klik pada banner beranda mencakup 35% dari total jumlah klik, dan 37% dari sesi yang menghasilkan klik, menunjukkan bobotnya yang besar
  • Ini adalah area dengan frekuensi tayang tinggi dan dampak konversi bisnis yang sangat besar

Keterbatasan metode rekomendasi sebelumnya

  • Sebelumnya, rekomendasi dilakukan dengan memanfaatkan algoritme MAB (Multi-Armed Bandit) yang berfokus pada CTR
    • Menyeimbangkan exploration dan exploitation
  • Tiga keterbatasan:
    • Ketergantungan pada satu metrik CTR sehingga kurang mampu merefleksikan beragam preferensi pelanggan dan karakteristik banner
    • Sulit merefleksikan keterkaitan antar-banner (diproses secara independen)
    • Cold start (penurunan performa saat data klik untuk banner baru masih kurang)
  • Untuk mengatasi keterbatasan ini, tim merancang sistem rekomendasi baru

Pipeline sistem rekomendasi

  • Sistem disusun sebagai pipeline multi-tahap
    1. Memperkuat representasi banner: mengekstrak embedding berbasis teks, gambar, dan produk terkait banner (menggunakan HGNN dan GraphSAGE)
    2. Melatih model prediksi klik: menerapkan model DeepFM (interaksi fitur) dan Two-Tower (embedding pengguna/banner terpisah) secara bersamaan
    3. Scoring dan penerapan banner: menghitung skor prediksi CTR per pengguna secara batch/real-time
      • Untuk pengguna dengan data yang cukup, diterapkan personalisasi yang presisi
      • Untuk pengguna baru atau cold user, digunakan rekomendasi berbasis segmen
    4. Merefleksikan kebijakan bisnis: selain skor sistem, kebijakan dan strategi perusahaan, banner kampanye, serta perubahan darurat juga direfleksikan secara real-time
    5. Penayangan banner final: merekomendasikan dan menampilkan banner Top-N dengan skor tertinggi

Pengenalan model inti rekomendasi

  • DeepFM: struktur paralel FM (interaksi orde-2) + DNN (interaksi berdimensi tinggi) yang efektif mempelajari data sparse dan interaksi kompleks, sangat unggul untuk prediksi CTR
  • Two-Tower: mengekstrak embedding pengguna dan banner dari jaringan saraf yang independen, unggul pada data berskala besar dan serving real-time, serta cocok untuk rekomendasi berbasis kemiripan

DeepFM

  • Menggabungkan layer FM (interaksi fitur orde-2) + layer DNN (integrasi fitur nonlinier berdimensi tinggi)
  • Kuat terhadap data sparse, dan mengoptimalkan performa secara konsisten lewat struktur pembelajaran end-to-end
  • Menggunakan informasi pengguna, metadata banner, dan informasi embedding (64 dimensi) sebagai fitur
  • Vektor embedding diproses sebagai satu blok tunggal untuk memastikan efisiensi dan stabilitas pembelajaran
  • Hasil prediksi CTR digunakan untuk menghasilkan peringkat banner

Two-Tower

  • Menghasilkan embedding pengguna dan banner di jaringan saraf terpisah (tower), lalu menghitung kemiripan
  • Memungkinkan skalabilitas untuk data skala besar, serta respons cepat dengan vektorisasi sebelumnya (latensi rendah)
  • Tiap tower memanfaatkan beragam input seperti demografi, log perilaku, teks/gambar, dan lainnya
  • Struktur pemisahan pembelajaran/pemrosesan paralel memungkinkan penanganan masalah rekomendasi skala besar secara cepat dan fleksibel

Tantangan utama saat diterapkan di lingkungan produksi

  • Banner beranda memiliki siklus hidup yang sangat pendek (2–3 hari, bahkan bisa per jam), sehingga membutuhkan refleksi real-time
  • Sinyal feedback terutama bergantung pada klik, sehingga sulit membedakan preferensi pengguna yang sebenarnya
  • Tidak seperti produk atau brand, banner kekurangan metadata yang terstruktur, sehingga konteks gambar dan teks sulit dipahami
  • Ketidakseimbangan data per store (perbedaan traffic dan aktivitas antar-kategori store) dapat menurunkan performa keseluruhan
  • Untuk mengatasi masalah ini, sistem didesain ulang dengan tiga sumbu teknis utama: memperkuat daya representasi, menjaga kebaruan, dan mengurangi ketidakseimbangan

Langkah perbaikan yang nyata

Memperkuat karakteristik banner

  • Untuk mengatasi keterbatasan penggunaan rata-rata embedding PinSAGE (keterbatasan dalam merepresentasikan banner kompleks dan ketidakmampuan merekomendasikan banner baru), tim mengadopsi HGNN
  • Berdasarkan pola perilaku pengguna, hubungan banner-produk di dalam struktur graf di-embedding dengan GraphSAGE
  • Untuk informasi teks dan gambar, digunakan kombinasi embedding LLM
  • Diterapkan pembaruan embedding pengguna secara real-time serta Continual Learning untuk merefleksikan minat pengguna terbaru
  • CTR naik 8,3%

Continual Learning

  • Beranjak dari pembelajaran batch pada seluruh data, diperkenalkan pembaruan berkelanjutan (per 1 jam, menggunakan log 3 jam terbaru)
  • Learning rate disesuaikan secara dinamis menurut volume aktivitas (maksimum 5x per minggu, 2x pada malam hari)
  • Mewujudkan adaptasi cepat dan pencegahan penuaan model, serta refleksi rekomendasi yang cepat tanpa penurunan performa
  • CTR naik 24%

Pemilihan model yang strategis

  • Menetapkan strategi pemodelan optimal untuk tiap store
  • Main store menggunakan DeepFM+Continual, sedangkan kategori store khusus memakai model individual Two-Tower, dengan peningkatan CTR 19%

Hasil akhir

  • Dibandingkan MAB sebelumnya, Two-Tower meningkatkan CTR 11,2% dan DeepFM 16,1%
  • Pada praktiknya, beranda Musinsa menerapkan DeepFM+Continual Learning, sementara kategori store khusus menggunakan model Two-Tower

Arah selanjutnya

  • Akan terus didorong pengembangan seperti transisi ke arsitektur serving real-time, penerapan Multi-Task Learning (CTR+GGMV), peningkatan kualitas embedding dan struktur graf, serta diversifikasi metrik kinerja
  • Ada rencana mengembangkan model yang melampaui CTR tunggal menjadi model yang juga mengevaluasi pencapaian berbagai tujuan bisnis dan pengalaman berkualitas

1 komentar

 
codemasterkimc 2025-06-05

Tulisan yang bagus ~