- Mengubah perintah bahasa alami menjadi interaksi browser (kode Selenium) untuk mengotomatisasi browser
- Bertujuan mengotomatisasi tugas-tugas sederhana yang berulang, memakan waktu, dan hampir tidak memerlukan upaya kognitif, atas nama pengguna
- Dirancang untuk mempermudah otomatisasi alur kerja web dan mengeksekusinya di browser dengan menyediakan engine yang mengubah kueri bahasa alami menjadi kode Selenium
Fitur utama
- Pemrosesan bahasa alami: Memahami instruksi dalam bahasa alami untuk melakukan interaksi di browser
- Integrasi Selenium: Terintegrasi mulus dengan Selenium untuk mengotomatisasi browser web
- Open source: Dibangun di atas proyek open-source seperti transformers dan llama-index, serta memanfaatkan model open-source yang menjamin transparansi agar selaras dengan kepentingan pengguna
- Dukungan model lokal untuk privasi dan kontrol: Mendukung model lokal seperti
Gemma-7b agar pengguna dapat sepenuhnya mengendalikan asisten AI dan menjaga privasi
- Teknologi AI tingkat lanjut: Menggunakan embedding lokal (
bge-small-en-v1.5) untuk menjalankan RAG dan mengekstrak bagian HTML yang paling relevan, lalu memanfaatkan Few-shot learning dan Chain of Thought untuk memperoleh kode Selenium yang paling relevan untuk menjalankan tugas tanpa perlu melakukan fine-tuning pada LLM (Nous-Hermes-2-Mixtral-8x7B-DPO) untuk generasi kode
Memulai
- Anda dapat mencoba LaVague di notebook Colab.
Roadmap
- Meski masih merupakan proyek awal, ini berpotensi berkembang untuk memopulerkan model AI yang transparan dan selaras yang dapat bertindak di internet untuk pengguna.
- Area eksplorasi utama mencakup fine-tuning model lokal agar dapat menjadi ahli di Text2Action, meningkatkan pencarian agar hanya menggunakan bagian kode yang relevan untuk generasi kode, serta mendukung engine browser lain (misalnya playwright) atau framework otomatisasi lainnya.
Opini GN⁺
- LaVague memiliki potensi untuk menghemat waktu dan meningkatkan produktivitas dengan mengotomatisasi tugas-tugas berulang pengguna. Ini bisa sangat berguna terutama untuk pekerjaan seperti input data berulang atau pengisian formulir.
- Karena dikembangkan berbasis open source, LaVague memberikan transparansi dan kemungkinan modifikasi bagi pengguna maupun pengembang. Ini dapat membantu mendorong inovasi berbasis komunitas dan membangun kepercayaan pengguna.
- Teknologi otomatisasi yang ditangani LaVague sudah terintegrasi dengan alat yang telah akrab bagi banyak perusahaan dan pengembang, seperti Selenium, sehingga dapat dengan mudah diintegrasikan ke alur kerja yang sudah ada.
- Otomatisasi yang memanfaatkan teknologi AI menuntut akurasi dan efisiensi yang tinggi. Teknologi seperti Few-shot learning dan Chain of Thought yang disediakan LaVague dapat membantu meminimalkan kesalahan yang mungkin terjadi saat menangani tugas yang kompleks.
- Penerapan teknologi semacam ini memerlukan perhatian terhadap privasi pengguna dan keamanan data. Dukungan terhadap model lokal bisa menjadi salah satu cara untuk mengurangi kekhawatiran ini, tetapi pengguna tetap perlu memantau dengan cermat bagaimana data mereka diproses.
2 komentar
Kelihatannya sangat bagus karena bisa diuji coba di lingkungan notebook. Syukurlah integrasi
playwrightada di milestone,,Komentar Hacker News
Pendapat tentang mencoba alat baru
Pengalaman mengosongkan Google Photos
Pendapat tentang alat otomatisasi browser seperti TaxyAI
Pengalaman dengan pengujian Selenium
Kekhawatiran tentang pengabaian instruksi otomatisasi di situs web
Pendapat tentang dampak potensial otomatisasi
Ketertarikan pada kompatibilitas model
Dampak terhadap pemungutan suara online
Pentingnya benchmark yang menunjukkan tingkat keberhasilan
Ketertarikan pada proyek