Project Mariner dari Google DeepMind - alat otomatisasi browser
(deepmind.google)- Cara baru menggunakan browser
- Mengotomatiskan tugas di browser dengan memanfaatkan kemampuan pemahaman dan penalaran multimodal yang kuat berbasis Gemini 2.0
- Memahami dan menalar semua elemen seperti piksel, teks, kode, gambar, formulir, dan lainnya di layar browser
- Native Multimodality : memahami dan menalar semua konten di browser
- Menganalisis elemen kompleks seperti teks, kode, dan gambar di situs web
- Merespons perintah suara dan memberikan umpan balik visual tentang progres pekerjaan
- Browser Interaction : memahami dan menavigasi situs web yang kompleks secara real-time
- Berinteraksi dengan situs web atas nama pengguna
- Mengotomatiskan tugas berulang untuk menghemat waktu
- Meminta penjelasan yang lebih jelas jika tidak memahami perintah
- Reasoning : memahami instruksi yang kompleks dan membaginya menjadi langkah-langkah yang dapat dijalankan
- Memahami hubungan dan fungsi antar elemen web
- Menunjukkan proses perencanaan dan eksekusi tugas secara transparan sehingga pengguna dapat memahami proses pengambilan keputusan
- Saat ini hanya tersedia untuk kelompok uji tepercaya berskala kecil : jika ingin ikut serta dalam pengujian, perlu mendaftar ke daftar tunggu
1 komentar
Browser headless yang dioptimalkan untuk AI mulai bermunculan…
server web memberikan respons yang dioptimalkan untuk browser itu…
hari ketika mereka(?) saling berbicara tampaknya tidak lama lagi…