2 poin oleh GN⁺ 2024-12-26 | 1 komentar | Bagikan ke WhatsApp

1 komentar

 
GN⁺ 2024-12-26
Komentar Hacker News
  • Ada pertanyaan mengenai alasan menggunakan model mixbread
  • Ada pertanyaan tentang peningkatan efisiensi saat men-binarisasi embedding dan memakai jarak Hamming
  • Ada pertanyaan mengapa memilih Milvus dibandingkan penyimpanan vektor lain
  • Ada pertanyaan tentang apakah metadata diperbarui otomatis setiap minggu
  • Ada umpan balik positif terhadap pencarian "byte-level transformer", namun paper terbaru tidak ditemukan
    • Jika ingin hasil yang lebih padat, bisa mempertimbangkan opsi UI untuk memperkecil abstrak agar lebih banyak item langsung terlihat
  • Saat mempertimbangkan perluasan di luar ArXiv, penerbit besar memaksa penghapusan abstrak di OpenAlex, sehingga review literatur bisa menjadi lebih sulit
  • Ada pertanyaan apakah Anda sudah mengecek alat lain seperti undermind.ai, scite.ai, dan elicit.org
  • Perlu dipertimbangkan apa yang dapat dimasukkan ke alur kerja produk khusus untuk literature review selain fitur pencarian
  • Di masa lalu, brute force CPU secara real-time dimungkinkan pada basis data vektor seperti gensim/doc2vec
  • Ada ide lain tentang bidang lain yang baik untuk penerapan pencarian semantik
    • Pencarian iklan online: embedding dan pengindeksan iklan video dan gambar agar bisa menemukan inspirasi pemasaran
    • Pencarian lintas platform e-commerce: menemukan produk di Sephora, Zara, H&M, dan sebagainya
  • Ada pendapat bahwa menambahkan tautan "paper serupa" pada setiap paper akan membantu dalam menemukan topik
  • Ada pertanyaan tentang keuntungan apa pun pencarian semantik dibandingkan pencarian teks
    • Ada pertanyaan apakah ada benchmark untuk mengecek apakah itu meningkatkan pencarian
  • Ada pertanyaan apakah ini mirip dengan Semantic Scholar dari Allen Institute for AI
  • Ada usulan menambahkan klien alat pencarian di backend paper-qa
  • Ada pendapat untuk mencoba meng-crawl lalu menghubungkannya ke scihib
  • Ada komentar tentang masalah encoding
    • Mencari "UPC high-performance computing benchmark" menampilkan paper dengan bug pada nama penulis