17 poin oleh xguru 8 jam lalu | 4 komentar | Bagikan ke WhatsApp
  • Mesin browser headless yang dioptimalkan untuk web scraping dan otomatisasi agen AI
  • Menyematkan mesin V8 untuk menjalankan JavaScript sungguhan, dan dengan implementasi Chrome DevTools Protocol (CDP), kode Puppeteer·Playwright dapat digunakan ulang apa adanya
  • Jauh lebih ringan dibandingkan Chrome headless: memori 30MB (vs 200MB+), biner 70MB (vs 300MB+), pemuatan halaman 85ms (vs ~500ms)
  • Dengan tingkat pemuatan halaman sekitar 85ms, waktu tunggu saat crawling dalam jumlah besar berkurang 5~10 kali dibandingkan Chrome
  • Distribusi biner tunggal sehingga tanpa dependensi eksternal seperti Chrome atau Node.js
  • Mode stealth bawaan dengan --stealth:
    • Pengaturan bypass anti-bot diterapkan otomatis, seperti menyembunyikan navigator.webdriver dan menyamarkan fungsi native
    • Randomisasi fingerprint per sesi (GPU, canvas, audio, dll.)
  • Pemblokiran otomatis tracker iklan, analitik, dan telemetri di 3.520 domain, yang juga meningkatkan kecepatan rendering halaman
  • Dari CLI, gunakan obscura fetch untuk merender satu halaman, dan obscura serve untuk menjalankan server WebSocket CDP
  • obscura scrape url1 url2 ... --concurrency 25 untuk scraping paralel yang mudah
  • Seperti --eval "document.title", Anda bisa langsung mengeksekusi ekspresi JS dari CLI dan hanya mengambil hasilnya, berguna untuk ekstraksi data sederhana
  • Mendukung domain utama seperti Target, Page, Runtime, DOM, Network, Fetch, dan Input melalui API CDP, termasuk konversi DOM→Markdown (LP.getMarkdown)
  • Saat submit form atau login, pemrosesan POST, redirect 302, dan pemeliharaan cookie ditangani otomatis, sehingga tidak perlu mengimplementasikan sendiri alur autentikasi
  • Lisensi Apache 2.0

4 komentar

 
xguru 8 jam lalu

Ini adalah browser headless yang belakangan sedang sangat naik daun.
Selain ringan, browser ini juga populer karena mode stealth-nya dikabarkan bekerja dengan baik.

 
okxrr 8 jam lalu

GitHub-nya baru dibuat sebulan lalu

Saat saya coba cari sederhana di Google, sejauh ini tidak ada reaksi atau ulasan yang menonjol.
Di Hacker News, Reddit, dan tempat lain juga hampir tidak terlihat..
Apa saya yang tidak bisa menemukannya..
Tapi star-nya sudah lebih dari 6 ribu

Kalau yang sedang ramai itu biasanya bisa dicek di mana?
Ini kelihatannya seperti software yang sangat berbahaya..

 
xguru 8 jam lalu

Saya lebih sering melihatnya di Twitter. Katanya mudah untuk diotomatisasi.
Secara pribadi saya belum sempat menguji mode stealth, jadi saya juga tidak bisa banyak menilai.

 
okxrr 7 jam lalu

Sepertinya ini bukan hal yang umum. (Belakangan ada banyak proyek seperti ini, jadi mungkin juga sudah bisa dianggap umum..)

Ini adalah program yang kemungkinan besar akan digunakan dengan memasukkan informasi sensitif,
jadi sepertinya lebih baik dipakai setelah diberi waktu dulu.