Pencarian Google kewalahan oleh serangan spam berskala besar
- Hasil pencarian Google dalam beberapa hari terakhir diserang spam hingga berada dalam kondisi yang benar-benar tidak terkendali.
- Banyak domain menempati peringkat untuk ratusan ribu kata kunci, sehingga skala serangan ini bisa mencapai jutaan frasa kata kunci.
Bagaimana algoritma Google dapat dimanfaatkan
- Situs spam tampaknya memanfaatkan setidaknya tiga celah dalam cara Google memberi peringkat pada situs web.
- Kueri pencarian tempat situs spam berhasil naik peringkat memiliki persaingan rendah sehingga lebih mudah untuk diperingkatkan.
- Ada celah yang dimanfaatkan pada algoritma pencarian lokal, kata kunci long-tail, dan domain yang baru didaftarkan.
- Situs baru memiliki keuntungan karena selama periode singkat saat Google masih memahami situs tersebut, mereka dapat memperoleh peringkat untuk kueri pencarian tertentu.
Tautan membantu Google menemukan situs spam
- Fakta ini diketahui melalui postingan Bill Hartzer yang menggunakan alat backlink Majestic untuk mengungkap jaringan tautan dari beberapa situs spam.
- Meskipun banyak upaya dikeluarkan untuk membangun jaringan backlink, tautan bukanlah faktor yang benar-benar menentukan peringkat tinggi.
- Tautan membantu Google menemukan dan merayapi situs spam baru, yang pada akhirnya kemudian diberi peringkat.
Spam di Google SERP yang tidak terkendali
- Sejumlah situs mendapatkan peringkat untuk frasa long-tail yang mudah diperingkatkan serta frasa yang memiliki komponen pencarian lokal.
- Konsep long-tail sudah ada hampir 20 tahun dan dipopulerkan oleh buku "The Long Tail" yang terbit pada 2006.
- Situs spam dapat memperoleh peringkat untuk frasa dengan persaingan rendah, lalu memanfaatkannya untuk meraih peringkat pada ratusan ribu kata kunci dalam waktu singkat.
Seperti apa halaman spam itu
- Mengunjungi halaman spam melalui browser tidak memungkinkan.
- Situs spam otomatis mengalihkan pengunjung ke domain lain.
- Situs spam dikunjungi menggunakan Rich Results Tester milik Google untuk merekam HTML halaman tersebut.
Satu domain mendapatkan peringkat untuk lebih dari 300.000 kata kunci
- Spreadsheet yang dikirim Bill berisi daftar frasa kata kunci yang berhasil diperingkatkan oleh satu situs spam.
- Satu situs spam memperoleh peringkat untuk lebih dari 300.000 frasa kata kunci.
Mengapa teknik spam ini efektif
- Pencarian lokal menggunakan algoritma yang berbeda dari algoritma non-lokal.
- Algoritma pencarian lokal lebih permisif sehingga situs bertipe lokal lebih mudah mendapatkan peringkat.
- Google sudah mengetahui masalah spam ini setidaknya sejak 19 Desember, sebagaimana dikonfirmasi melalui tweet Danny Sullivan.
Opini GN⁺
- Hal terpenting dari artikel ini adalah bahwa hasil pencarian Google rentan terhadap serangan spam berskala besar, dan hal ini dapat memengaruhi keandalan mesin pencari.
- Alasan serangan spam ini efektif adalah karena memanfaatkan kerentanan tertentu dalam algoritma Google, yang menegaskan perlunya Google memperbaiki algoritmanya.
- Artikel ini menarik bukan hanya dari sisi teknis, tetapi juga karena menunjukkan bahwa perusahaan teknologi besar seperti Google pun masih bisa menghadapi masalah yang tidak terduga.
7 komentar
Dokumen pelaporan spam Google: saat melaporkan spam web, jika domainnya seperti
abc.abc.uk/trashasda, laporkan sebagaiabc.uk, lalu laporkan juga dengan memasukkanabc.abc.uk/sitemap.xmlke kolom kata kunci pencarian yang paling bisa menjelaskan masalahnya secara akurat. Sepertinya ini adalah situs yang sudah dipersenjatai dengan solusi tertentu, dan saat pengguna biasa mengaksesnya, strukturnya langsung membuat dokumen turunan lagi. Cara menanganinya memang dengan aktif melaporkannya; setiap kali ditekan di Google, halaman spam akan dibuat lagi, dan ada juga proses yang membuat bot mengaksesnya melaluigoogle.com/url,image.google.com/url,naver redirect, dan semacamnya lalu berpindah lagi ke halaman spam yangdibuat, jadi jangan diklik, cukup salin tautannya saja lalu laporkan. Selama algoritme pengalihan yang ditandai sebagaigoogle.com/urltidak dihapus, tampaknya masalah saat ini akan terus muncul.(laporkan spam, dokumen web spam)
Jika Anda melaporkan dokumen web yang termasuk dalam solusi spam di atas,
yang benar adalah mengisi total 5 kolom: kolom pertama dengan domain utama, lalu 4 URL tambahan dengan daftar dokumen turunan yang dibuat dari sana. Sebaiknya sitemap domain tersebut juga dimasukkan ke kata pencarian. Jika sitemap dibuka, mereka memakai strategi yang membuat halaman seperti
/new/asdasddibuat begitu diakses, jadi saat Anda menyusun dokumen laporan, pada akhirnya Google akan memicu pembuatan dokumen tambahan yang kabur saat ditinjau. Karena pelakunya cukup licik seperti itu, Anda harus melaporkannya pada tingkat domain.Dalam kasus saya
(h diubah menjadi x, / diubah menjadi |)
xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2
Setelah menulis laporan seperti ini,
jika itu situs yang sudah membusuk mulai dari subdomain, saya mengirim laporan dengan kata kunci seperti ini: site:*baddomain.com.
Setelah itu, jika situsnya sendiri benar-benar bersifat spam, saya juga sekalian mengirim laporan situs phishing.
Perangkat lunak di situs web spam tersebut ironisnya terhubung dengan tag manager, dan pengindeksan tetap berjalan normal meskipun menggunakan situs seperti https://picsum.photos. Ini juga berarti Google tidak melakukan peninjauan. Bahkan ketika aktivitas spam sudah melampaui batas yang wajar, jika dokumen web spam + iklan AdWords masih aktif, maka seberapa sering pun dilaporkan, dokumen turunan akan dibuat dengan cepat sebanding dengan jumlah trafik dari iklan. Fakta bahwa situs web spam menggunakan tag manager secara normal adalah bagian yang benar-benar bikin merinding.
Saya sudah sebulan mengirim laporan spam, tetapi jika Anda juga melaporkannya sebagai dokumen spam atau dokumen penipuan dan sekaligus melaporkannya lewat halaman pelaporan situs phishing, penanganannya bisa dilakukan lebih cepat. Halaman tersebut juga saya masukkan, tetapi jika domain tingkat atasnya adalah
abc.abc.uk, Anda harus memasukkanabc.ukagar membantu menindak domain itu sendiri. Ini sudah menjadi pekerjaan rumah sehari-hari bagi para webmaster.Google memang sejak dulu sudah terlihat mengalami penurunan kualitas hasil pencarian secara keseluruhan, dan jika diserang secara massal dalam waktu singkat seperti ini, makin banyak orang yang jadi tidak bisa mempercayai hasil pencarian Google.
Opini Hacker News
Situs spam memeriksa alamat IP Googlebot
Pengalaman pengguna yang beralih ke mesin pencari Kagi
Meningkatnya situs yang memberikan teks berlebihan hanya untuk menjawab pertanyaan sederhana
Pengamatan tentang penurunan kualitas hasil pencarian Google
Muncul pertanyaan tentang mesin pencari
Sorotan terhadap perubahan algoritma mesin pencari Google
Klaim bahwa Google telah meninggalkan pencarian organik
Sorotan atas keterbatasan mesin pencari Google
Berbagi pengalaman beralih ke Bing
Kritik terhadap perilaku Google sebagai perusahaan iklan