43 poin oleh sigridjineth 2025-01-30 | Belum ada komentar. | Bagikan ke WhatsApp

Sebuah tulisan yang meninjau seluruh proses embedding dan information retrieval — mulai dari konsep dan keterbatasan embedding, pembuatan serta pelabelan dataset, evaluasi berbagai model off-the-shelf, hybrid dan re-ranking, fine-tuning serta optimisasi model embedding, hingga interpretabilitas.

Topik yang dibahas

  • Embedding dan pembahasan tentang generalizability-nya
  • Pembangunan dan pelabelan dataset dengan memanfaatkan manusia + LLM
  • Evaluasi 17 model pencarian
  • Saat menggunakan model embedding dengan konteks panjang, keputusan tentang apakah perlu membagi chunk atau tidak
  • Pencarian hybrid dan re-ranking
  • Evaluasi layanan pencarian SaaS komersial
  • Fine-tuning model embedding
  • Optimisasi model embedding dan pencarian vektor
  • Implementasi pencarian neural yang interpretable

Belum ada komentar.

Belum ada komentar.