1 poin oleh GN⁺ 5 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Penurunan kualitas mesin pencari menjadi momentum untuk kembali memanfaatkan hyperlink dan halaman tautan pribadi, cara lama menjelajahi web
  • Google sudah sulit dipakai dengan baik selama bertahun-tahun, DuckDuckGo/Bing terus memburuk, dan Yandex relatif mengesankan tetapi tetap belum mencapai tingkat terdepan
  • YouTube benar-benar yang terburuk; wajah-wajah serupa dan latar judul yang dipoles terus berulang sehingga membuat orang menghindari pencarian itu sendiri
  • Kagi tampaknya bergantung pada mesin pencari di atas, dan ringkasan pencarian LLM memiliki keterbatasan sebagai ringkasan non-deterministik yang dibangun di atas hasil pencarian berkualitas rendah
  • Jika situs pribadi menautkan langsung ke situs web yang mereka sukai, itu menjadi cara untuk merebut kembali World Wide Web per hyperlink melawan web yang tersentralisasi

Pokok persoalan

  • Titik tolaknya adalah kesadaran bahwa penurunan kinerja mesin pencari kini sulit untuk disangkal
  • Google sudah tidak layak dipakai selama bertahun-tahun, DuckDuckGo/Bing terus memburuk, dan Yandex lebih mengesankan jika dibandingkan, tetapi masih tertinggal beberapa langkah dari tingkat terdepan di masa lalu
  • Pencarian YouTube menjadi sesuatu yang secara naluriah dihindari karena video-video dengan wajah dan kartu judul berformat serupa terus berulang
  • Kagi sering direkomendasikan, tetapi tampaknya bergantung pada tiga penyedia yang disebutkan sebelumnya
  • LLM bisa melakukan pencarian sebagai pengganti, tetapi ketika hasil pencarian itu sendiri berkualitas rendah, ringkasan non-deterministik yang dibangun di atasnya tidak menyelesaikan masalah

Respons yang diusulkan

  • Solusinya adalah berpikir di luar kotak pencarian, dan jawabannya adalah hyperlink
  • Pada masa awal web, orang sering menemukan situs menarik lain dengan mengeklik halaman “links” yang umum ada di situs-situs keren
  • Tautan-tautan itu kadang tidak relevan atau sudah mati, tetapi kadang justru sangat tepat dan mengarah ke situs yang membekas lama dalam ingatan
  • Alih-alih meratapi web yang tersentralisasi, pengelola situs dapat langsung menautkan situs web yang mereka sukai
  • links page baru saya bukan “web ring” ataupun saling mengikuti, melainkan sekadar daftar hal-hal yang saya sukai
  • Saya tidak berharap situs yang saya tautkan akan menautkan balik, dan sekalipun seseorang menautkan saya, mereka juga seharusnya tidak mengharapkan tautan balik
  • Jika tiap orang menautkan ke tempat yang mereka inginkan dan membuat halaman tautan versinya sendiri, itu menjadi cara untuk merebut kembali World Wide Web satu hyperlink demi satu hyperlink

1 komentar

 
GN⁺ 5 jam lalu
Opini di Lobste.rs
  • Sayangnya, saya melihat Google benar-benar menaruh tautan yang cukup bagus di dalam panel ringkasan AI, dan tautan-tautan itu biasanya lebih baik daripada hasil pencarian teratas biasa Misalnya saat mencari "what is a linked list", di paling atas panel samping area AI muncul thread Reddit, lalu setelah itu artikel Wikipedia yang relevan. Secara pribadi saya rasa Wikipedia seharusnya di peringkat 1, tapi bagaimanapun hasilnya begitu Sementara hasil pencarian biasa peringkat 1 adalah artikel GeeksForGeeks, dan bukan bermaksud menyerang GeeksForGeeks, tetapi itu artikel yang sangat dioptimalkan untuk search engine optimization dan mendapat peringkat tinggi meski ada konten yang lebih baik di web. Dalam kasus ini, Wikipedia ada di peringkat 2 Bahkan jika LLM memilih tautan dengan lebih baik, saya rasa bukan itu yang sebenarnya terjadi; kemungkinan besar ini hasil yang dirancang dengan hati-hati, dan ini contoh klasik enshittification. Tautan bagus disembunyikan di dalam ``, dan kalau diklik, di metrik mereka Anda menjadi konsumen rongsokan yang bahagia. Karena mereka sudah tahu hasil pencarian yang sebenarnya memang buruk

    • Saya memang bilang “bukan bermaksud menyerang GeeksForGeeks”, tetapi situs itu memang layak banyak dikritik. Mereka jago dalam search engine optimization, tetapi jarang benar-benar punya informasi yang dicari, dan bahkan sebelum kata ‘slop’ jadi populer, kontennya sudah seperti itu. Karena itu, itu salah satu situs yang saya blokir dari hasil pencarian
    • Salah satu pencerahan besar buat saya adalah: alih-alih memakai mesin pencari umum, kalau sudah jelas ada pencarian khusus yang lebih cocok, lebih baik pakai itu. Kalau mencari linked list, kemungkinan besar yang saya inginkan ada di Wikipedia, jadi tidak ada alasan khusus untuk memakai Google Saya menambahkan pintasan di Firefox sehingga kalau mengetik @w linked list, saya langsung dibawa ke Wikipedia. Bisa juga untuk pencarian yang lebih sempit dan khusus seperti Arch Wiki, MDN, Stack Overflow, IMDB, dan lainnya Gagasan bahwa satu perusahaan boleh mengoperasikan layanan yang menemukan jenis informasi apa pun di seluruh dunia sejak awal sudah cukup meragukan. Saya pernah menulis tentang ini tahun lalu Mudah untuk bernostalgia bahwa “dulu kita bisa memasukkan beberapa kata kunci ke Google dan menemukan apa pun yang ada”, tetapi sebenarnya itu tidak pernah benar. Sebagai imbalan karena tidak perlu tersesat di web yang kacau, kita mengizinkan Google mengubah definisi web itu sendiri. Kita bilang “kalau tidak ada di Google, berarti tidak ada”, padahal itu salah, dan baru sekarang kita mulai melihat seberapa salahnya Mustahil secara mendasar memandang seluruh web secara objektif dari sudut pandang dewa. Untuk mengindeks sesuatu sebesar web sambil mencegah penyalahgunaan, ribuan keputusan kecil dan besar harus dibuat. Setiap kali melakukan pencarian—bahkan setiap kali membuat abstraksi—kita menerima penyederhanaan atas kenyataan. Peta bukanlah wilayah, dan indeks bukanlah web https://search.technomancy.us/why
    • Ada yang disebut “kode Konami untuk membatalkan enshittification” di &udm=14. Ini selalu mengalihkan ke tab pencarian Web yang biasanya tersembunyi di bawah “More”. Saya sudah menyalakannya di beberapa perangkat selama beberapa waktu dan sangat puas karena bisa mendapatkan kembali pencarian yang “bodoh” Cacat dari search engine optimization dan manipulasi peringkat masih tetap ada, tetapi setidaknya ini mengembalikan sebagian rasa kendali yang dirampas oleh ringkasan AI
    • Fenomena ini sudah berlangsung cukup lama, dan tahun lalu saya bahkan pernah menulis contohnya di blog. Ini sangat menjengkelkan, dan tampaknya tak mungkin bukan desain yang disengaja untuk membuat orang bertahan lebih lama di situs Google Menurut saya, kesepakatan antara Google dan situs web hampir tidak berlaku lagi. Jika mereka tidak siap menampilkan tautan ke situs saya, mengapa saya harus mengizinkan bot mereka merayapi situs saya?
  • Seperti yang pernah disebut di blog, kalau belum pernah mencobanya, ada baiknya mencoba Kagi sekali. Sudah umum diketahui bahwa Kagi memakai data crawl atau indeks pencarian dari mesin pencari besar lain, tetapi mereka hanya memakai datanya dan peringkat hasil pencarian ditentukan sendiri. Saya sudah memakainya lebih dari 2 tahun dan puas; bahkan pernah menemukan sesuatu yang tidak bisa saya temukan dengan DuckDuckGo. Di hasil pencarian, kita bisa menaikkan, menurunkan, atau memblokir situs, dan ada banyak fitur seperti Redirects (URL Rewrites). Saya juga suka cara Kagi berkomunikasi secara terbuka. Di Changelog ada tautan ke tiap tiket di Kagi Feedback, dan tempat itu juga berfungsi sebagai pelacak isu. Ada juga halaman Status. Terkait ide membuat halaman tautan di situs sendiri, Kagi Small Web agak mirip, dan di Kagi Small Web website kita bisa mengunjungi situs secara acak. John Gruber (Daring Fireball) dan Cory Doctorow (Pluralistic) juga memakainya. Contohnya bisa dilihat di Seriously, Give Kagi a Try, Another Periodic Suggestion to Try, Just Try, Switching to Kagi for Search, Tim Bray: ‘Mourning Google’, The Talk Show: ‘A Professional Internet User’, With Kagi Founder and CEO Vlad Prelovac, dan Tag: kagi. Ada uji coba 100 pencarian, dan tergantung volume pencarian, paket Starter seharga $54 per tahun mungkin sudah cukup. Kalau butuh lebih, bisa cek di Individual Pricing. Ada juga Duo and Family, jadi biaya per orang bisa lebih rendah, tetapi hanya tersedia di Professional. Upgrade atau downgrade bisa dilakukan kapan saja, dan sisa saldo akan dihitung secara prorata lalu diterapkan ke paket baru.

    • Tetapi Kagi memakai Yandex, jadi membayar mereka pada akhirnya berarti secara tidak langsung mendukung rezim Putin. Saya tidak ingin mendukung sesuatu yang saya tahu ikut membunuh warga Ukraina.
    • Sebenarnya mereka mengagregasi dari berbagai sumber. Meski begitu, saya setuju bahwa Kagi tetap luar biasa, dan saya baru saja memperpanjang langganan.
    • Setahu saya DuckDuckGo juga bisa memblokir situs di hasil pencarian. Sepertinya tidak ada fitur untuk menaikkan atau menurunkan situs, atau setidaknya saya belum pernah mencobanya. Perlu juga diketahui bahwa sebelum beralih ke pencarian, Kagi awalnya dimulai sebagai perusahaan AI [https://help.kagi.com/kagi/ai/kagi-ai.html]. Saya tidak bermaksud menyiratkan apa pun hanya dari fakta ini, tetapi mungkin banyak yang belum tahu, jadi saya bagikan. Lebih langsung lagi, keseluruhan tulisannya terasa seperti iklan, jadi sebaiknya nasihatnya diterima dengan hati-hati.
    • Saya sering mendengar banyak pujian untuk Kagi, tetapi dalam kasus saya hasilnya tidak seberuntung itu. Bukan berarti saya menyangkal pengalaman tersebut; saya rasa mungkin saja saya memakainya dengan cara yang salah. Karena itu saya penasaran jenis pencarian apa yang dimasukkan ke Kagi. Kata kunci patokan saya adalah "sesans spin echo length formula". Di DuckDuckGo, tautan pertama adalah halaman SESANS Wiki, tetapi tidak memuat rumus yang saya cari, dan tautan kedua adalah makalah yang berisi rumus tersebut. Di Google, tautan pertama adalah materi konferensi yang banyak membahas dasar matematis SESANS, tetapi juga tidak punya rumus yang saya inginkan; lagi-lagi tautan kedua adalah makalah yang memuat rumus itu. Penjelasan konstantanya juga lebih baik daripada tautan kedua di DDG. Di Kagi, saya baru melihat hubungan yang saya cari pada tautan keenam. Menurut standar saya, Kagi lebih buruk, tetapi mungkin standar saya sendiri juga kurang bagus. Saya penasaran jenis pencarian seperti apa yang paling cocok untuk Kagi.
    • Saya dulu suka Kagi, tetapi berhenti memakainya setelah tahu mereka mengalirkan uang ke Rusia. Belakangan ini saya mulai memakai Uruky dan lumayan suka. Tidak sempurna, tetapi lebih baik daripada Google saat ini. Hanya saja saya belum menelusuri sumber datanya secara mendalam dan baru memastikan bahwa itu bukan Yandex, jadi kalau ada yang tahu lebih banyak saya penasaran.
  • Pada 2024, Google dan Reddit menandatangani kontrak senilai $60 juta agar konten Reddit bisa dipakai untuk pelatihan AI Google. Karena itu, pencarian Google belakangan ini terasa mirip seperti menambahkan awalan site:Reddit. Situs-situs lama yang bagus jadi tidak relevan dan tersembunyi di belakang hasil berkualitas rendah.

  • Belakangan ini saya bertanya-tanya apakah solusi yang tepat justru direktori yang dikurasi manusia seperti situs Yahoo di masa awal, ditambah cara untuk mencari situs-situs di dalamnya. Marginalia tampaknya agak mirip, tetapi saya tidak melihat direktori di sana.

    • Saya juga memikirkan hal yang sama. Penulisnya pada dasarnya sedang menemukan kembali direktori web, dan meskipun ada masalah skalabilitas, rasanya waktunya memang sudah datang lagi.
    • Betul. Itu dia. Tolong, semoga ada yang membuatnya.
  • Saya tidak tahu apakah pernyataan “Kagi tampaknya bergantung pada 3 penyedia yang disebut di atas” itu benar, tetapi secara harfiah itu tidak terlalu penting. Pencarian Kagi benar-benar luar biasa, dan bahkan kalau harganya dua kali lipat pun saya mungkin tetap akan membayar. Rata-rata saya melakukan 1.432 pencarian per bulan, dan itu sangat sepadan.

    • Saya penasaran perbedaan apa yang Anda lihat saat menjalankan Kagi berdampingan dengan mesin pencari lain. Adakah contoh kata kunci pencarian?
  • Ada yang bilang “penurunan fungsi mesin pencari sekarang sulit disangkal”, tetapi apakah hanya saya yang tidak merasakannya? Saya masih tetap bisa mencari dan menemukan yang saya butuhkan.

  • Saya sedang memikirkan pendekatan untuk terus-menerus menyimpan cache hampir semua hal dan mengindeksnya untuk pencarian teks penuh. Rasanya ada materi yang menghilang dari web atau menjadi benar-benar mustahil ditemukan lagi Dulu pernah ada proyek serupa yang dibagikan di sini. Ide dasarnya adalah menggunakan SQLite dan FTS5 untuk semuanya. Rasanya area ini perlu dieksplorasi lebih jauh

    • Saya membuat mesin pencari super-personal saya sendiri dengan SQLite FTS5. Saya belum mengindeks riwayat peramban, hanya bookmark dan semua URL yang saya posting di akun media sosial saya. Meski begitu, saya jelas sedang mempertimbangkan untuk mengindeks riwayat peramban juga. https://search.technomancy.us Saya rasa akan bagus kalau orang lain juga ikut bereksperimen
  • Saya melihat ini disebut di dua komentar, tapi layak ditinggalkan sebagai tautan. Marginalia Search luar biasa https://marginalia-search.com/ https://about.marginalia-search.com/

  • Saya sudah menulis tanggapan kepada orang lain di thread ini, tetapi karena tampaknya relevan dengan tulisan blognya, saya menuliskannya juga di tingkat atas. Kalau terlihat terlalu seperti promosi diri atau terasa kurang nyaman, silakan hapus Singkatnya, kalau diringkas tanpa banyak kesan pribadi, saya sempat melewati masa seperti berkabung karena merasa telah kehilangan web yang saya kenal saat tumbuh besar. Namun, banyak dari itu sebenarnya masih tersisa di suatu tempat, saya saja yang tidak mengetahuinya. Tentu web modern tidak sama, dan sebagian besar dari apa yang saya “ratapi” memang adalah nostalgia atau hal-hal seperti usia saya saat itu, tetapi web tetap luas, menarik, berguna, dan penuh hal-hal menyenangkan. Hanya saja, bahkan sebelum alat AI mulai melahap mesin pencari, semua itu sudah menjadi sangat sulit ditemukan Saya banyak memikirkan pengalaman apa yang saya lewatkan, dan karena berbagai alasan saya sampai pada kesimpulan yang sama dengan penulis blog tersebut. Tautan menuju hal-hal bagus harus dibagikan oleh orang sungguhan, dan kita perlu membangun sikap menjelajah web yang lebih lambat dan lebih disengaja. Dengan semangat itu, saya membuat alat untuk membangun direktori web kolaboratif: https://linklists.net Masih sangat kecil dan banyak bagian yang kasar. Karena ini lebih dekat ke proyek seni sekaligus alat, saya hampir tidak pernah mempromosikannya, dan sejauh ini hanya sedikit menyebarkannya kepada orang-orang di ranah web indie. Sudah berjalan dalam versi alfa selama beberapa bulan, dan saya sudah bisa melihat bagian-bagian yang perlu banyak diubah, tetapi kalau ada yang penasaran dan ingin mencobanya, silakan lihat