insane-search - Membuat Claude Code yang menyerah saat menemui 403 terus mencoba sampai berhasil
(github.com/fivetaku)Saya tidak suka Claude Code yang menyerah begitu menemui 403.
"Tolong baca tulisan ini di blog Naver" → 403. "Pilihkan keyboard di bawah 100.000 won dari Coupang" → 403. "Apa isi thread Reddit ini?" → diblokir. Akhirnya saya terus-menerus harus membuka browser sendiri lalu copy-paste untuknya. Rasanya aneh: saya menyuruh AI bekerja, tapi kenapa saya yang malah bekerja.
Saya sudah mencoba MCP yang ada, tetapi ada masalah. Kebanyakan terikat pada satu platform tertentu saja (khusus Twitter, khusus YouTube), atau meminta pendaftaran API key/OAuth, atau sudah belajar bias seperti "situs ini diblokir" sehingga bahkan tidak mencoba sama sekali. Situs berubah setiap hari dan caranya pun bisa saja berhasil sekarang, jadi tidak masuk akal untuk menyerah hanya karena pernah diblokir sekali.
Karena itu saya membuat lapisan pemilihan metode. Ini bukan scraper, melainkan skill yang mencoba endpoint publik dan teknik standar secara berurutan sampai bisa tembus.
Cara kerjanya
Saat Claude Code mengakses URL, scheduler adaptif 4 tahap akan membantu. Ia hanya berpindah ke Phase berikutnya jika Phase sebelumnya gagal atau mendeteksi sinyal pemblokiran.
- Phase 0: hanya mengindeks endpoint khusus yang tidak bisa ditemukan dengan rantai umum (15 grup) — X Syndication, Reddit
.json, HN Firebase, yt-dlp 1.858 situs - Phase 1: probe ringan paralel — WebFetch, Jina Reader, curl dengan UA Chrome/Mobile/Googlebot, variasi URL
m.{domain}/.json//rss - Phase 2: impersonasi TLS —
curl_cffiurutan safari → chrome → firefox (jika belum terpasang akan otomatispip install) - Phase 3: browser sungguhan — render dengan Playwright MCP + temukan API tersembunyi (
network_requests) - jika mendeteksi login/paywall, proses diakhiri sebagai "perlu autentikasi". Tidak terus mencoba tanpa guna
Dari semua respons HTML, tag OGP + data terstruktur JSON-LD juga ikut diekstrak. Walaupun isi penuh artikelnya tidak bisa diambil, judul/harga/profil tetap bisa didapat.
Situs Korea bekerja sangat baik
- Blog Naver → sebagian besar teratasi dengan variasi URL mobile
- Coupang → ekstraksi JSON-LD ItemList dengan
curl_cffi safaridi Phase 2 - DC Inside/FM Korea/Clien/Karrot/Yozm IT/Wishket → semuanya bisa dibaca lewat Jina Reader atau curl
- Naver Finance → JSON API tidak resmi
api.finance.naver.com/siseJson.naver(tanpa autentikasi) - 9 media Korea → indeks RSS + fallback Google News RSS
Prinsip inti
Jangan membangun bias. Saya tidak membuat daftar "situs ini sulit". Saya juga tidak melewatinya hanya karena dependensi belum ada — saya pasang lalu coba. Karena baik situs maupun metodenya bisa saja berhasil saat ini.
Instalasi
/plugin marketplace add https://github.com/fivetaku/gptaku_plugins.git
/plugin install insane-search
Setelah restart, selesai. Tidak ada API key/pendaftaran/variabel lingkungan. Cukup bicara seperti biasa, dan ini akan otomatis terpicu saat URL yang diblokir muncul.
2 komentar
agent browser dari vercel-labs benar-benar luar biasa
Apakah tidak bisa dibuat agar
browser-uselangsung digunakan?