1 poin oleh GN⁺ 2023-12-24 | 7 komentar | Bagikan ke WhatsApp

Pencarian Google kewalahan oleh serangan spam berskala besar

  • Hasil pencarian Google dalam beberapa hari terakhir diserang spam hingga berada dalam kondisi yang benar-benar tidak terkendali.
  • Banyak domain menempati peringkat untuk ratusan ribu kata kunci, sehingga skala serangan ini bisa mencapai jutaan frasa kata kunci.

Bagaimana algoritma Google dapat dimanfaatkan

  • Situs spam tampaknya memanfaatkan setidaknya tiga celah dalam cara Google memberi peringkat pada situs web.
  • Kueri pencarian tempat situs spam berhasil naik peringkat memiliki persaingan rendah sehingga lebih mudah untuk diperingkatkan.
  • Ada celah yang dimanfaatkan pada algoritma pencarian lokal, kata kunci long-tail, dan domain yang baru didaftarkan.
  • Situs baru memiliki keuntungan karena selama periode singkat saat Google masih memahami situs tersebut, mereka dapat memperoleh peringkat untuk kueri pencarian tertentu.

Tautan membantu Google menemukan situs spam

  • Fakta ini diketahui melalui postingan Bill Hartzer yang menggunakan alat backlink Majestic untuk mengungkap jaringan tautan dari beberapa situs spam.
  • Meskipun banyak upaya dikeluarkan untuk membangun jaringan backlink, tautan bukanlah faktor yang benar-benar menentukan peringkat tinggi.
  • Tautan membantu Google menemukan dan merayapi situs spam baru, yang pada akhirnya kemudian diberi peringkat.

Spam di Google SERP yang tidak terkendali

  • Sejumlah situs mendapatkan peringkat untuk frasa long-tail yang mudah diperingkatkan serta frasa yang memiliki komponen pencarian lokal.
  • Konsep long-tail sudah ada hampir 20 tahun dan dipopulerkan oleh buku "The Long Tail" yang terbit pada 2006.
  • Situs spam dapat memperoleh peringkat untuk frasa dengan persaingan rendah, lalu memanfaatkannya untuk meraih peringkat pada ratusan ribu kata kunci dalam waktu singkat.

Seperti apa halaman spam itu

  • Mengunjungi halaman spam melalui browser tidak memungkinkan.
  • Situs spam otomatis mengalihkan pengunjung ke domain lain.
  • Situs spam dikunjungi menggunakan Rich Results Tester milik Google untuk merekam HTML halaman tersebut.

Satu domain mendapatkan peringkat untuk lebih dari 300.000 kata kunci

  • Spreadsheet yang dikirim Bill berisi daftar frasa kata kunci yang berhasil diperingkatkan oleh satu situs spam.
  • Satu situs spam memperoleh peringkat untuk lebih dari 300.000 frasa kata kunci.

Mengapa teknik spam ini efektif

  • Pencarian lokal menggunakan algoritma yang berbeda dari algoritma non-lokal.
  • Algoritma pencarian lokal lebih permisif sehingga situs bertipe lokal lebih mudah mendapatkan peringkat.
  • Google sudah mengetahui masalah spam ini setidaknya sejak 19 Desember, sebagaimana dikonfirmasi melalui tweet Danny Sullivan.

Opini GN⁺

  • Hal terpenting dari artikel ini adalah bahwa hasil pencarian Google rentan terhadap serangan spam berskala besar, dan hal ini dapat memengaruhi keandalan mesin pencari.
  • Alasan serangan spam ini efektif adalah karena memanfaatkan kerentanan tertentu dalam algoritma Google, yang menegaskan perlunya Google memperbaiki algoritmanya.
  • Artikel ini menarik bukan hanya dari sisi teknis, tetapi juga karena menunjukkan bahwa perusahaan teknologi besar seperti Google pun masih bisa menghadapi masalah yang tidak terduga.

7 komentar

 
devstudyman7 2024-03-09

Dokumen pelaporan spam Google: saat melaporkan spam web, jika domainnya seperti abc.abc.uk/trashasda, laporkan sebagai abc.uk, lalu laporkan juga dengan memasukkan abc.abc.uk/sitemap.xml ke kolom kata kunci pencarian yang paling bisa menjelaskan masalahnya secara akurat. Sepertinya ini adalah situs yang sudah dipersenjatai dengan solusi tertentu, dan saat pengguna biasa mengaksesnya, strukturnya langsung membuat dokumen turunan lagi. Cara menanganinya memang dengan aktif melaporkannya; setiap kali ditekan di Google, halaman spam akan dibuat lagi, dan ada juga proses yang membuat bot mengaksesnya melalui google.com/url, image.google.com/url, naver redirect, dan semacamnya lalu berpindah lagi ke halaman spam yang dibuat, jadi jangan diklik, cukup salin tautannya saja lalu laporkan. Selama algoritme pengalihan yang ditandai sebagai google.com/url tidak dihapus, tampaknya masalah saat ini akan terus muncul.

 
devstudyman7 2024-03-09

Jika Anda melaporkan dokumen web yang termasuk dalam solusi spam di atas,
yang benar adalah mengisi total 5 kolom: kolom pertama dengan domain utama, lalu 4 URL tambahan dengan daftar dokumen turunan yang dibuat dari sana. Sebaiknya sitemap domain tersebut juga dimasukkan ke kata pencarian. Jika sitemap dibuka, mereka memakai strategi yang membuat halaman seperti /new/asdasd dibuat begitu diakses, jadi saat Anda menyusun dokumen laporan, pada akhirnya Google akan memicu pembuatan dokumen tambahan yang kabur saat ditinjau. Karena pelakunya cukup licik seperti itu, Anda harus melaporkannya pada tingkat domain.

 
devstudyman7 2024-03-09

Dalam kasus saya
(h diubah menjadi x, / diubah menjadi |)

xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2

Setelah menulis laporan seperti ini,

jika itu situs yang sudah membusuk mulai dari subdomain, saya mengirim laporan dengan kata kunci seperti ini: site:*baddomain.com.

Setelah itu, jika situsnya sendiri benar-benar bersifat spam, saya juga sekalian mengirim laporan situs phishing.

 
devstudyman7 2024-03-09

Perangkat lunak di situs web spam tersebut ironisnya terhubung dengan tag manager, dan pengindeksan tetap berjalan normal meskipun menggunakan situs seperti https://picsum.photos. Ini juga berarti Google tidak melakukan peninjauan. Bahkan ketika aktivitas spam sudah melampaui batas yang wajar, jika dokumen web spam + iklan AdWords masih aktif, maka seberapa sering pun dilaporkan, dokumen turunan akan dibuat dengan cepat sebanding dengan jumlah trafik dari iklan. Fakta bahwa situs web spam menggunakan tag manager secara normal adalah bagian yang benar-benar bikin merinding.

 
devstudyman7 2024-03-09

Saya sudah sebulan mengirim laporan spam, tetapi jika Anda juga melaporkannya sebagai dokumen spam atau dokumen penipuan dan sekaligus melaporkannya lewat halaman pelaporan situs phishing, penanganannya bisa dilakukan lebih cepat. Halaman tersebut juga saya masukkan, tetapi jika domain tingkat atasnya adalah abc.abc.uk, Anda harus memasukkan abc.uk agar membantu menindak domain itu sendiri. Ini sudah menjadi pekerjaan rumah sehari-hari bagi para webmaster.

 
aobamisaki 2023-12-24

Google memang sejak dulu sudah terlihat mengalami penurunan kualitas hasil pencarian secara keseluruhan, dan jika diserang secara massal dalam waktu singkat seperti ini, makin banyak orang yang jadi tidak bisa mempercayai hasil pencarian Google.

 
GN⁺ 2023-12-24
Opini Hacker News
  • Situs spam memeriksa alamat IP Googlebot

    • Jika terdeteksi sebagai Googlebot, konten akan ditampilkan di halaman tersebut
    • Pengunjung lain akan dialihkan ke domain lain yang berisi konten mencurigakan
    • Di masa lalu, Google tidak mengizinkan situs menampilkan konten yang berbeda kepada Googlebot dan pengguna biasa, dan pelanggaran terhadap aturan ini dikenai penalti besar
    • Kebijakan ini sudah hilang, tetapi jika alat otomatis bekerja dengan baik, ini masih bisa berguna
  • Pengalaman pengguna yang beralih ke mesin pencari Kagi

    • Kadang sulit mendapatkan hasil pencarian yang bagus, tetapi di Google pun hasilnya tidak lebih baik
    • Pengguna menyesuaikan hasil pencarian sesuai preferensi pribadi dengan melakukan 'boost' dan 'pin' pada domain
    • Mereka masih menggunakan layanan Google lain seperti Gmail dan Google Maps, tetapi tidak lagi menggunakan pencariannya
  • Meningkatnya situs yang memberikan teks berlebihan hanya untuk menjawab pertanyaan sederhana

    • Jawaban sebenarnya berada di bagian bawah halaman
    • Sekilas tampak relevan, tetapi sebenarnya isinya umum saja
  • Pengamatan tentang penurunan kualitas hasil pencarian Google

    • Tidak jelas kapan tren ini mulai terjadi, tetapi mungkin sudah lama tidak mendapat perhatian yang cukup
    • Serangan spam ini bisa jadi merupakan tahap terakhir
  • Muncul pertanyaan tentang mesin pencari

    • Konsep mesin pencari satu tujuan yang berbasis perayapan web mungkin akan menghilang
    • Bisa jadi lebih baik menggantikan Google dengan beberapa sistem untuk tujuan tertentu
    • Misalnya, pertanyaan teknis dicari langsung di StackOverflow dan GitHub, pencarian tempat lokal di basis data tepercaya, dan sebagainya
    • Mesin pencari dapat berkembang ke arah memanfaatkan LLM (model bahasa besar) untuk menebak jenis pencarian lalu mengarahkan ke pencarian khusus yang telah dikurasi
  • Sorotan terhadap perubahan algoritma mesin pencari Google

    • Google terkadang mengubah algoritma dan memengaruhi peringkat situs
    • Perubahan ini dapat membuat hasil berkualitas rendah naik ke posisi atas untuk kueri tertentu
    • Di masa lalu, memantau dan mendiskusikan pembaruan algoritma seperti ini di situs terkait SEO merupakan hal yang penting
  • Klaim bahwa Google telah meninggalkan pencarian organik

    • Bahkan pengguna yang mahir SEO pun sulit memahami alasan penentuan peringkat dalam hasil pencarian Google
    • Google membuat hasil berbayar menjadi lebih bernilai agar pengguna terdorong mengklik iklan berbayar
  • Sorotan atas keterbatasan mesin pencari Google

    • Berguna saat mencari sesuatu yang spesifik, tetapi selain itu mereka menggunakan Bing, ChatGPT, Phind, dan lainnya
    • Gim milik pengguna muncul di hasil teratas di Bing dan mesin pencari lain, tetapi di Google justru situs iklan spam yang diprioritaskan
  • Berbagi pengalaman beralih ke Bing

    • Setelah perkembangan Bing yang memanfaatkan ChatGPT, mereka mulai menggunakan Bing alih-alih Google
    • Memang belum sempurna, tetapi dibandingkan Google hasilnya lebih memuaskan
  • Kritik terhadap perilaku Google sebagai perusahaan iklan

    • Setelah membuat akun Gmail baru dan tidak memberi tahu siapa pun, mereka tetap menerima email spam
    • Menganggap Google menjual daftar alamat emailnya sendiri terdengar masuk akal