- Artikel tentang mesin pencari Wikipedia berbasis browser baru, dengan kemampuan pencarian offline
- Fitur mesin pencari yang menelusuri satu juta halaman Wikipedia secara real-time, mengembalikan hasil setiap 10ms di perangkat seluler
- Ukuran database mesin pencari yang kecil, mendukung satu juta embedding tanpa pemrosesan khusus untuk kasus penggunaan kasual
- Mesin pencari yang menggunakan sentence transformer untuk embedding dokumen, kompresi embedding dengan product quantization, dan
pq.js yang menjalankan perhitungan jarak di browser
- Mesin pencari yang menggunakan
transformers.js untuk menjalankan sentence transformer di dalam browser untuk kueri
- Mesin pencari yang mengurutkan embedding berdasarkan ukuran halaman terkompresi, sehingga halaman dengan kepadatan informasi tinggi dianalisis lebih dulu dan dikembalikan di 10 peringkat teratas
- Mesin pencari yang menggunakan Arrow alih-alih JSON untuk performa tinggi; Arrow dapat menyimpan array product quantization integer 8-bit secara ringkas
- Mesin pencari yang menggunakan model ONNX yang berjalan di WebAssembly, belum memiliki akselerasi GPU
- Mesin pencari yang melakukan embedding seluruh Wikipedia dengan sentence transformer, mengompresi embedding dengan product quantization, dan menulis ONNX secara manual
- Mesin pencari yang mengekspor numpy ke Arrow untuk menyimpan embedding dan metadata, jauh lebih ringkas di memori maupun di disk
- Mesin pencari yang mendukung pencarian berfaset yang memungkinkan pencarian real-time di subkategori produk
- Penulis mengundang masukan dan usulan perbaikan, khususnya terkait dukungan tingkat kuantisasi lain dan dimensi embedding lain
1 komentar
Pendapat Hacker News