Saat ini GeekNews menggunakan pencarian Google yang di-embed,
namun secara pribadi saya merasa ini agak kurang nyaman.
Jika saya mengingat kata kunci perkiraan dari berita yang baru-baru ini saya lihat lalu mencarinya,
sulit menemukannya karena tidak ada cara untuk mengurutkan berdasarkan yang terbaru.
Saya juga pernah melihat implementasi yang memasukkan vector store dengan wasm,
tetapi karena search engine bukan bidang saya, saya kesulitan membayangkan bagaimana merancangnya.
Kalau fuzzy search dan sejenisnya diimplementasikan di sisi frontend,
rasanya itu akan menambah beban server.
Ini memang lebih untuk bahan obrolan, tetapi adakah cara yang efektif untuk mengimplementasikannya?
7 komentar
Saya penggemar pencarian, sampai bisa dibilang maniak pencarian, tapi kira-kira berapa banyak volume pencarian per hari?
Kalau jumlahnya tidak banyak, sambil tetap mempertahankan metode pencarian yang ada secara kasar, kita bisa mencoba pencarian bahasa alami dengan menggunakan model
rerank.Ini kira-kira struktur pencarian dari layanan yang pernah saya buat sebelumnya.
Secara garis besar, pertama saya kirim query ke es, lalu menerapkan cohere rerank api, dan menyajikannya berdasarkan isi yang skor rerank-nya paling cocok menurut natural language.
Tapi setelah dipikir-pikir, kalau yang Anda embed itu Google, sepertinya memang tidak ada cara khusus untuk mengambil isi html di dalam item hasil pencarian. Meski begitu, saya tetap meninggalkan tautannya.
Tautan : https://dev-wiki.dev/reading/tech/1
Saya sangat senggang dan suka pencarian, jadi jika masih ada hal terkait yang ingin dibicarakan, saya akan berterima kasih jika Anda meninggalkannya : )
Dalam kasus saya, cukup tidak nyaman karena hasil terbaru tidak muncul lebih dulu. Rasanya, seperti forum BBS lama, pencarian sederhana dengan kueri LIKE akan lebih sesuai dengan kebutuhan saya. Meski begitu, mungkin perlu sedikit mempertimbangkan
rangedemi kecepatan..Saya juga merasakan ketidaknyamanan ini. Misalnya, saat mencari "AI", cukup sering artikel dari 5 tahun lalu muncul di halaman pertama.
Sepertinya hasil pencarian Google yang di-embed keluar dalam bentuk JSON, jadi ambil saja itu lalu urutkan.
Coba periksa request
https://cse.google.com/cse/element/v1Bagaimana kalau mencari langsung di Google?
query: site:news.hada.io duckdb
https://google.com/search/…