1 poin oleh GN⁺ 2023-09-03 | 1 komentar | Bagikan ke WhatsApp
  • Artikel tentang mesin pencari Wikipedia berbasis browser baru, dengan kemampuan pencarian offline
  • Fitur mesin pencari yang menelusuri satu juta halaman Wikipedia secara real-time, mengembalikan hasil setiap 10ms di perangkat seluler
  • Ukuran database mesin pencari yang kecil, mendukung satu juta embedding tanpa pemrosesan khusus untuk kasus penggunaan kasual
  • Mesin pencari yang menggunakan sentence transformer untuk embedding dokumen, kompresi embedding dengan product quantization, dan pq.js yang menjalankan perhitungan jarak di browser
  • Mesin pencari yang menggunakan transformers.js untuk menjalankan sentence transformer di dalam browser untuk kueri
  • Mesin pencari yang mengurutkan embedding berdasarkan ukuran halaman terkompresi, sehingga halaman dengan kepadatan informasi tinggi dianalisis lebih dulu dan dikembalikan di 10 peringkat teratas
  • Mesin pencari yang menggunakan Arrow alih-alih JSON untuk performa tinggi; Arrow dapat menyimpan array product quantization integer 8-bit secara ringkas
  • Mesin pencari yang menggunakan model ONNX yang berjalan di WebAssembly, belum memiliki akselerasi GPU
  • Mesin pencari yang melakukan embedding seluruh Wikipedia dengan sentence transformer, mengompresi embedding dengan product quantization, dan menulis ONNX secara manual
  • Mesin pencari yang mengekspor numpy ke Arrow untuk menyimpan embedding dan metadata, jauh lebih ringkas di memori maupun di disk
  • Mesin pencari yang mendukung pencarian berfaset yang memungkinkan pencarian real-time di subkategori produk
  • Penulis mengundang masukan dan usulan perbaikan, khususnya terkait dukungan tingkat kuantisasi lain dan dimensi embedding lain

1 komentar

 
GN⁺ 2023-09-03
Pendapat Hacker News
  • Artikel tentang alat baru yang dapat menelusuri Wikipedia secara offline
  • Beberapa pengguna melaporkan bahwa akurasi alat ini lebih rendah dibanding layanan AI seperti ChatGPT
  • Alat ini menggunakan embedding teks untuk mencocokkan kueri pencarian
  • Makalah terbaru berjudul "Pencarian teks berdasarkan deskripsi abstrak" memungkinkan kueri pencarian yang lebih abstrak
  • Beberapa pengguna menemukan bahwa alat ini kurang efektif dibanding Google dalam mengembalikan hasil yang mereka harapkan
  • Seorang pengguna mengusulkan bahwa alat ini bisa ditingkatkan dengan hanya melakukan embedding pada kalimat atau paragraf yang mendefinisikan, bukan seluruh dokumen artikel Wikipedia
  • Ada pujian untuk kemampuan offline dan implementasi alat ini, meskipun ada beberapa kritik terhadap akurasinya
  • Beberapa pengguna mengalami masalah teknis terkait alat ini, seperti waktu pemuatan yang lambat
  • Disebutkan proyek serupa bernama SemanticFinder, yang memungkinkan pengguna menyalin dan menempel teks dengan panjang berapa pun lalu mengembalikan segmen yang paling mirip
  • Seorang pengguna menunjukkan bahwa efektivitas alat ini mungkin dibatasi oleh kualitas representasi topik di Wikipedia
  • Beberapa pengguna kecewa dengan hasil alat ini, tetapi tetap mengakui teknologi mengesankan di baliknya
  • Seorang pengguna menyarankan bahwa pendekatan alat ini yang melakukan embedding pada seluruh artikel mungkin bukan yang terbaik untuk jenis aplikasi seperti ini