Google menghapus seluruh Bear Blog dari indeks pencarian, tetapi alasannya tidak diketahui
(journal.james-zhan.com)- Blog pribadi blog.james-zhan.com sepenuhnya dikeluarkan dari indeks pencarian Google hanya sebulan setelah dibuat
- Tepat setelah salah memvalidasi URL feed RSS di Google Search Console (GSC), semua posting ditandai dengan status “Crawled – currently not indexed”
- Berbagai kemungkinan penyebab seperti pengaturan domain, kualitas konten, dan struktur tautan internal sudah diperiksa dan tidak ditemukan masalah
- Dengan bantuan Herman, pendiri Bear Blog, DNS, HTML/CSS, dan masalah platform juga telah disingkirkan, sementara di mesin pencari lain situs terindeks normal
- Pada akhirnya blog dipindahkan ke subdomain baru dan diputuskan untuk membiarkan Google mengindeksnya secara alami, tetapi penyebabnya masih belum jelas
Situasi awal
- Blog dibuat pada 4 Oktober dan memuat tulisan panjang bergaya kolom opini pertama
- Setelah sitemap dikirim ke Google Search Console (GSC) dan permintaan pengindeksan diajukan, blog langsung muncul di hasil pencarian keesokan harinya
- Setelah itu, setiap kali artikel baru dipublikasikan, permintaan pengindeksan kembali diajukan dan semuanya tercermin dengan normal
Muncul masalah
- Pada 14 Oktober, setelah melihat pesan di GSC bahwa satu URL tidak diindeks, penulis mengklik tombol “Validate”
- URL tersebut adalah feed RSS (
feed/?type=rss), bukan halaman sebenarnya
- URL tersebut adalah feed RSS (
- Pada 20 Oktober, setelah menerima email dari GSC bertuliskan “some fixes failed”, semua posting dihapus dari indeks
- Pesan statusnya adalah “Page is not indexed: Crawled – currently not indexed”
- Mengirim ulang sitemap dan meminta pengindeksan untuk tiap URL juga tidak memberi hasil
Pelacakan penyebab
- Hari dimulainya validasi pengindeksan dan hari ketika seluruh posting menjadi tidak terindeks adalah hari yang sama
- Tidak jelas apakah upaya validasi feed RSS itulah yang memicu masalah
- Setelah itu, artikel-artikel baru yang dipublikasikan pun semuanya tetap berada dalam status error yang sama
- Pada 3 November, bahkan satu posting terakhir yang masih tersisa ikut dikeluarkan dari indeks
Pemeriksaan kemungkinan penyebab
- Masalah domain:
james-zhan.comyang digunakan di GoDaddy terindeks normal pada subdomain lain → bukan penyebab - Kualitas konten: Jika dibandingkan dengan kasus Bear Blog lain, tidak ada masalah dari sisi jumlah maupun kualitas konten → bukan penyebab
- Kurangnya tautan internal: Struktur dasar Bear Blog sama, dan blog lain tetap terindeks normal → bukan penyebab
- Faktor lain: Berdasarkan pemeriksaan Herman, pendiri Bear Blog
- DNS, HTML/CSS, dan pengaturan platform semuanya normal
- Kode CSS kustom pengguna juga tidak memengaruhi pengindeksan
Mesin pencari lain dan tindakan yang diambil
- Di DuckDuckGo, Bing, Brave, dan lainnya, blog tetap terindeks dengan normal
- Hal ini mengarah pada dugaan bahwa masalahnya ada di pihak Google, bukan cacat teknis
- Blog kemudian dipindahkan ke subdomain baru (journal.james-zhan.com) dan
- Domain dipindahkan dari GoDaddy ke Porkbun
- URL forwarding disetel agar tautan lama otomatis mengarah ke blog baru
- Untuk blog baru, sitemap tidak dikirim ke GSC dan dibiarkan menunggu pengindeksan alami
- Penyebabnya masih belum terungkap, dan penulis mempertanyakan kurangnya transparansi sistem pengindeksan Google
1 komentar
Komentar Hacker News
AI Overview tidak bisa saya kendalikan, tetapi setelah saya menambahkan
noindexke halaman pencarian, trafik pulih dalam seminggu.Detailnya saya tulis di posting blog saya
/searchsepertinya di-cache dan terekspos ke crawler.Sebaiknya halaman pencarian jangan di-cache, dan terapkan noindex dengan X-Robots-Tag
Ke depan, sepertinya kita perlu melacak trafik dengan alat analitik sendiri
Sekarang orang hanya melihat ringkasan dan iklan lalu pergi
Mungkinkah ada situs lain yang menautkan URL pencarian itu sehingga ikut dirayapi?
Kalau Google memberi tautan sumber pada kalimat-kalimat ringkasannya, mungkin CTR bisa sedikit pulih
Saat sebuah situs dikenai sanksi, kita tidak bisa tahu alasannya maupun mengajukan keberatan.
Google pada dasarnya berperan sebagai gatekeeper.
Karena fungsinya sudah seperti barang publik, perlu ada sistem dukungan dan tanggung jawab yang sepadan.
Regulasi bukan solusi untuk semuanya, tetapi untuk perusahaan setingkat utilitas seperti ini setidaknya harus ada kewajiban menjamin akses
Saat ini strukturnya membuat orang harus membayar iklan agar terlihat di hasil pencarian
Hasilnya, halaman yang terindeks turun drastis dari ribuan menjadi 100
Lihat screenshot.
Enam bulan kemudian pun belum pulih. Karena ini proyek pribadi saya tidak terlalu masalah, tetapi kalau ini bisnis saya pasti marah
Screenshot terbaru
Kalau beroperasi cukup lama, kadang malah diakui sebagai “hak penggunaan yang sudah ada”.
Saya bahkan pernah melihat screenshot Google Maps diajukan sebagai bukti di pengadilan
ternyata itu usaha penipuan. Mereka merusak kunci lalu meminta $600.
Setelah saya laporkan, Google cepat menghapusnya, tetapi menurut saya untuk kasus seperti ini perlu verifikasi identitas asli saat pendaftaran
Masalahnya, di dunia nyata kadang justru kenyataan berubah mengikuti peta
Dalam proses administratif, sering kali lolos dengan pola pikir “kalau tidak ada yang komplain berarti tidak masalah”
Situs saya salah dikenali sebagai konten duplikat sehingga ter-deindex.
Di Bing tidak ada masalah, tetapi hanya Google yang membuat kesalahan seperti ini
sementara halaman Reddit yang muncul justru versi terjemahan dalam bahasa yang aneh.
Mungkin logika deduplikasi sedang bermasalah
Jika reverse proxy dipasang dari domain lain, Google akan mengindeksnya sebagai duplikat.
Sebaiknya gunakan tag canonical dan tautan path absolut
Padahal blog itu baik-baik saja selama 17 tahun
Spam sudah terlalu banyak sehingga false positive tampaknya ikut meningkat
Pendekatan seperti ini justru berdampak sebaliknya dengan menurunkan proporsi konten normal
Intinya sama dalam hal Google punya struktur yang menentukan siapa yang bertahan hidup
Kesalahan RSS mungkin hanya menjadi pemicu ketidakpedulian
tetapi apakah Google Maps benar-benar menyusul secepat itu?
Pengaruh Instagram atau TikTok juga tidak bisa diabaikan,
jadi rasanya ini interpretasi yang memberi terlalu banyak kekuasaan kepada Google
Pada akhirnya ini menjadi persoalan ayam atau telur lebih dulu.
Situs kecil tidak mendapat paparan sehingga tidak bisa tumbuh,
sementara situs besar terus tampil di atas tanpa masalah