- Mesin browser headless yang dioptimalkan untuk web scraping dan otomatisasi agen AI
- Menyematkan mesin V8 untuk menjalankan JavaScript sungguhan, dan dengan implementasi Chrome DevTools Protocol (CDP), kode Puppeteer·Playwright dapat digunakan ulang apa adanya
- Jauh lebih ringan dibandingkan Chrome headless: memori 30MB (vs 200MB+), biner 70MB (vs 300MB+), pemuatan halaman 85ms (vs ~500ms)
- Dengan tingkat pemuatan halaman sekitar 85ms, waktu tunggu saat crawling dalam jumlah besar berkurang 5~10 kali dibandingkan Chrome
- Distribusi biner tunggal sehingga tanpa dependensi eksternal seperti Chrome atau Node.js
- Mode stealth bawaan dengan
--stealth:
- Pengaturan bypass anti-bot diterapkan otomatis, seperti menyembunyikan
navigator.webdriver dan menyamarkan fungsi native
- Randomisasi fingerprint per sesi (GPU, canvas, audio, dll.)
- Pemblokiran otomatis tracker iklan, analitik, dan telemetri di 3.520 domain, yang juga meningkatkan kecepatan rendering halaman
- Dari CLI, gunakan
obscura fetch untuk merender satu halaman, dan obscura serve untuk menjalankan server WebSocket CDP
obscura scrape url1 url2 ... --concurrency 25 untuk scraping paralel yang mudah
- Seperti
--eval "document.title", Anda bisa langsung mengeksekusi ekspresi JS dari CLI dan hanya mengambil hasilnya, berguna untuk ekstraksi data sederhana
- Mendukung domain utama seperti Target, Page, Runtime, DOM, Network, Fetch, dan Input melalui API CDP, termasuk konversi DOM→Markdown (LP.getMarkdown)
- Saat submit form atau login, pemrosesan POST, redirect 302, dan pemeliharaan cookie ditangani otomatis, sehingga tidak perlu mengimplementasikan sendiri alur autentikasi
- Lisensi Apache 2.0
4 komentar
Ini adalah browser headless yang belakangan sedang sangat naik daun.
Selain ringan, browser ini juga populer karena mode stealth-nya dikabarkan bekerja dengan baik.
GitHub-nya baru dibuat sebulan lalu
Saat saya coba cari sederhana di Google, sejauh ini tidak ada reaksi atau ulasan yang menonjol.
Di Hacker News, Reddit, dan tempat lain juga hampir tidak terlihat..
Apa saya yang tidak bisa menemukannya..
Tapi star-nya sudah lebih dari 6 ribu
Kalau yang sedang ramai itu biasanya bisa dicek di mana?
Ini kelihatannya seperti software yang sangat berbahaya..
Saya lebih sering melihatnya di Twitter. Katanya mudah untuk diotomatisasi.
Secara pribadi saya belum sempat menguji mode stealth, jadi saya juga tidak bisa banyak menilai.
Sepertinya ini bukan hal yang umum. (Belakangan ada banyak proyek seperti ini, jadi mungkin juga sudah bisa dianggap umum..)
Ini adalah program yang kemungkinan besar akan digunakan dengan memasukkan informasi sensitif,
jadi sepertinya lebih baik dipakai setelah diberi waktu dulu.