- Jason Huggins, yang mengembangkan Selenium 21 tahun lalu, kini membangunnya kembali dengan mempertimbangkan agen AI dalam proyek open source otomatisasi browser ini
- Vibium adalah infrastruktur otomatisasi browser untuk agen AI, yang mengelola siklus hidup browser dan protokol WebDriver BiDi dalam satu biner tunggal serta mengekspos server MCP
- Clicker, biner Go tunggal berukuran 10MB, secara otomatis mendeteksi dan menjalankan Chrome, lalu memungkinkan model AI atau klien JS mengendalikan browser melalui proxy BiDi dan server MCP
- Klien JS/TS mendukung API sinkron maupun asinkron, dan dapat langsung digunakan setelah instalasi dengan
npm install vibium
- Agen LLM seperti Claude Code dapat menambahkan kemampuan kontrol browser hanya dengan satu perintah:
claude mcp add vibium
- Cocok untuk otomatisasi AI maupun otomatisasi pengujian, serta menyediakan lingkungan kontrol browser tanpa konfigurasi
Ikhtisar Vibium
- Vibium adalah infrastruktur otomatisasi browser untuk agen AI dan pengguna manusia
- Menggabungkan manajemen browser, proxy WebDriver BiDi, dan fungsi server MCP dalam satu biner Go
- Kompatibel dengan berbagai model LLM seperti Claude Code, Codex, Gemini, dan lainnya
- Dirancang untuk langsung berjalan tanpa proses instalasi yang rumit, sehingga dapat dimanfaatkan dalam lingkungan agen AI maupun otomatisasi pengujian
Komponen
- Clicker: biner Go sekitar 10MB yang menjalankan fungsi berikut
- Deteksi otomatis Chrome dan menjalankannya dalam mode BiDi
- Meneruskan perintah melalui server proxy BiDi berbasis WebSocket
- Berkomunikasi dengan agen LLM melalui server MCP
- Menyediakan fitur Auto-Wait untuk menunggu elemen sebelum berinteraksi
- Menyediakan fitur pengambilan screenshot
- Klien JS/TS: tersedia sebagai paket npm dan mendukung API sinkron (
browserSync) maupun asinkron (browser)
- Mengendalikan browser dengan perintah sederhana seperti
vibe.go(), vibe.find(), vibe.click(), vibe.quit()
- Mencakup fungsi otomatisasi dasar seperti menyimpan screenshot, mencari elemen, dan klik
Integrasi agen AI
Instalasi untuk pengguna manusia
- Instalasi otomatis dengan perintah
npm install vibium
- Mengunduh ke cache biner Clicker, Chrome for Testing, dan chromedriver sesuai platform
- Linux:
~/.cache/vibium/, macOS: ~/Library/Caches/vibium/, Windows: %LOCALAPPDATA%\vibium\
- Unduhan browser dapat dilewati dengan variabel lingkungan
VIBIUM_SKIP_BROWSER_DOWNLOAD=1
Dukungan platform
- Mendukung Linux x64, macOS (Intel/Apple Silicon), dan Windows x64
Mulai cepat
Roadmap
- V1: berfokus pada kontrol browser melalui MCP dan klien JS
- Rencana V2
- Klien Python dan Java
- Cortex (lapisan memori dan navigasi)
- Retina (fitur ekstensi perekaman)
- Perekaman video, fitur pencarian elemen berbasis AI
Belum ada komentar.