16 poin oleh GN⁺ 2025-01-10 | 1 komentar | Bagikan ke WhatsApp
  • Stagehand adalah framework penjelajahan web AI yang sederhana dan dapat diperluas, serta sepenuhnya kompatibel dengan Playwright
    • Menyediakan tiga API AI sederhana bernama act, extract, dan observe, yang memungkinkan otomatisasi web melalui bahasa alami
    • Meningkatkan aksesibilitas bahkan bagi pengguna nonteknis dan membuatnya tidak terlalu rentan terhadap perubahan kecil pada UI/DOM
    • Contoh: mengekstrak berita teratas dari Hacker News, mencari dan membeli AirPods di Amazon, serta mencari statistik 10 pertandingan terakhir Steph Curry di ESPN
  • Memudahkan penulisan kode otomatisasi browser yang tangguh dan berkinerja baik.
  • Saat digunakan bersama Browserbase, menyediakan alat debugging unggulan seperti pemutaran ulang sesi dan debugging langkah demi langkah.
  • Stagehand masih dalam tahap rilis awal dan sedang aktif mengumpulkan masukan dari komunitas.
  • Lisensi MIT

1 komentar

 
GN⁺ 2025-01-10
Komentar Hacker News
  • Ada pendapat bahwa saat mengekstrak data dari halaman menggunakan Stagehand, akan bagus jika ia mengembalikan elemen xpath yang bisa dipakai untuk melakukan scrap ulang halaman tanpa menggunakan LLM

    • Saat melakukan scrap pada halaman baru, alat LLM yang nondeterministik bisa digunakan, lalu saat melakukan scrap ulang untuk pembaruan konten, metode scraping tradisional bisa digunakan
    • Ada pertanyaan tentang seberapa stabil peralihan dari versi LLM ke versi xcode, dan apakah bisa kembali ke versi LLM jika skrip xcode gagal
    • Ada pendapat bahwa akan berguna untuk melakukan scraping dengan alat pintar, lalu seiring waktu membangun pustaka skrip scraping sederhana
  • Tidak setuju dengan ide bahwa Stagehand harus menggantikan Playwright dan sejenisnya

    • Secara pribadi ingin menggunakannya sebagai workflow perantara untuk menghasilkan kode Playwright yang deterministik, tetapi alat ini tampaknya ditujukan untuk eksekusi langsung
    • Ada pendapat bahwa akan sulit meyakinkan orang untuk menggunakan LLM saat runtime dalam test suite yang sedang dikerjakan
  • Pernah mencoba mengimplementasikan otomasi workflow menggunakan framework serupa, tetapi terhenti karena CAPTCHA tak terlihat

    • Instance Playwright bisa terdeteksi karena cara ia berinteraksi dengan DOM
    • Ada pandangan bahwa crawling dan scraping makin tidak terkendali sehingga pendekatan ini bisa menjadi standar
  • Ada pendapat bahwa nama "create-browser-app" terlalu umum, dan seharusnya dinamai "stagehand"

  • Sebelum membangun platform pengujian untuk testdriver.ai, pernah membuat SDK serupa bernama Goodlooks, tetapi tidak mendapat banyak respons

    • Membagikan tautan bagi orang-orang yang tertarik
  • Setelah mencoba Stagehand, ditemukan bahwa ini adalah abstraksi yang berguna

    • Berguna untuk membangun scraper terhadap situs web yang agresif karena proxy dan CAPTCHA sudah terintegrasi
    • Ingin tahu apakah ada rencana membuat abstraksi serupa untuk MCP dan penggunaan komputer
  • Menyukai fokus Stagehand untuk membuat otomasi browser lebih tangguh terhadap perubahan DOM

    • Metode act, extract, dan observe sangat rapi
    • Merekomendasikan browser headless ringan open source bernama Lightpanda
  • Ingin tahu apakah ada kemungkinan untuk mengotomatisasi tab browser yang sudah terbuka

  • Mengamati kecepatan luar biasa tim ini dalam mengembangkan produk di Slack, dan menantikan perkembangan selanjutnya

  • Ingin tahu apakah ini bekerja dengan mengubah metode AI menjadi submetode Playwright, dan apakah metode nyata hasil konversinya bisa di-debug

    • Ada pertanyaan apakah perintah yang berbeda bisa muncul pada setiap eksekusi pengujian, atau apakah ada perilaku yang deterministik