6 poin oleh yeorinhieut 2025-06-07 | 7 komentar | Bagikan ke WhatsApp

Saat ini GeekNews menggunakan pencarian Google yang di-embed,
namun secara pribadi saya merasa ini agak kurang nyaman.

Jika saya mengingat kata kunci perkiraan dari berita yang baru-baru ini saya lihat lalu mencarinya,
sulit menemukannya karena tidak ada cara untuk mengurutkan berdasarkan yang terbaru.

Saya juga pernah melihat implementasi yang memasukkan vector store dengan wasm,
tetapi karena search engine bukan bidang saya, saya kesulitan membayangkan bagaimana merancangnya.

Kalau fuzzy search dan sejenisnya diimplementasikan di sisi frontend,
rasanya itu akan menambah beban server.

Ini memang lebih untuk bahan obrolan, tetapi adakah cara yang efektif untuk mengimplementasikannya?

7 komentar

 
dankim0124 2025-07-10

Saya penggemar pencarian, sampai bisa dibilang maniak pencarian, tapi kira-kira berapa banyak volume pencarian per hari?

Kalau jumlahnya tidak banyak, sambil tetap mempertahankan metode pencarian yang ada secara kasar, kita bisa mencoba pencarian bahasa alami dengan menggunakan model rerank.

 
dankim0124 2025-07-10

Ini kira-kira struktur pencarian dari layanan yang pernah saya buat sebelumnya.

Secara garis besar, pertama saya kirim query ke es, lalu menerapkan cohere rerank api, dan menyajikannya berdasarkan isi yang skor rerank-nya paling cocok menurut natural language.

Tapi setelah dipikir-pikir, kalau yang Anda embed itu Google, sepertinya memang tidak ada cara khusus untuk mengambil isi html di dalam item hasil pencarian. Meski begitu, saya tetap meninggalkan tautannya.

Tautan : https://dev-wiki.dev/reading/tech/1

 
dankim0124 2025-07-10

Saya sangat senggang dan suka pencarian, jadi jika masih ada hal terkait yang ingin dibicarakan, saya akan berterima kasih jika Anda meninggalkannya : )

 
roxie 2025-06-09

Dalam kasus saya, cukup tidak nyaman karena hasil terbaru tidak muncul lebih dulu. Rasanya, seperti forum BBS lama, pencarian sederhana dengan kueri LIKE akan lebih sesuai dengan kebutuhan saya. Meski begitu, mungkin perlu sedikit mempertimbangkan range demi kecepatan..

 
ethanhur 2025-06-12

Saya juga merasakan ketidaknyamanan ini. Misalnya, saat mencari "AI", cukup sering artikel dari 5 tahun lalu muncul di halaman pertama.

 
ndrgrd 2025-06-08

Sepertinya hasil pencarian Google yang di-embed keluar dalam bentuk JSON, jadi ambil saja itu lalu urutkan.

Coba periksa request https://cse.google.com/cse/element/v1

 
felizgeek 2025-06-08

Bagaimana kalau mencari langsung di Google?
query: site:news.hada.io duckdb

https://google.com/search/…