Project Mariner dari Google DeepMind - alat otomatisasi browser

xguru · 2024-12-18T11:07:01+09:00

Cara baru menggunakan browser Mengotomatiskan tugas di browser dengan memanfaatkan kemampuan pemahaman dan penalaran multimodal yang kuat berbasis Gemini 2.0 Memahami dan menalar semua elemen seperti piksel, teks, kode, gambar, formulir, dan lainnya di layar browser Native Multimodality : memahami dan menalar semua konten di browser Menganalisis elemen kompleks seperti teks, kode, dan gambar di situs web Merespons perintah suara dan memberikan umpan balik visual tentang progres pekerjaan Browser Interaction : memahami dan menavigasi situs web yang kompleks secara real-time Berinteraksi dengan situs web atas nama pengguna Mengotomatiskan tugas berulang untuk menghemat waktu Meminta penjelasan yang lebih jelas jika tidak memahami perintah Reasoning : memahami instruksi yang kompleks dan membaginya menjadi langkah-langkah yang dapat dijalankan Memahami hubungan dan fungsi antar elemen web Menunjukkan proses perencanaan dan eksekusi tugas secara transparan sehingga pengguna dapat memahami proses pengambilan keputusan Saat ini hanya tersedia untuk kelompok uji tepercaya berskala kecil : jika ingin ikut serta dalam pengujian, perlu mendaftar ke daftar tunggu

(deepmind.google)

8 poin oleh xguru 2024-12-18 | 1 komentar | Bagikan ke WhatsApp

Cara baru menggunakan browser
Mengotomatiskan tugas di browser dengan memanfaatkan kemampuan pemahaman dan penalaran multimodal yang kuat berbasis Gemini 2.0
Memahami dan menalar semua elemen seperti piksel, teks, kode, gambar, formulir, dan lainnya di layar browser
Native Multimodality : memahami dan menalar semua konten di browser
- Menganalisis elemen kompleks seperti teks, kode, dan gambar di situs web
- Merespons perintah suara dan memberikan umpan balik visual tentang progres pekerjaan
Browser Interaction : memahami dan menavigasi situs web yang kompleks secara real-time
- Berinteraksi dengan situs web atas nama pengguna
- Mengotomatiskan tugas berulang untuk menghemat waktu
- Meminta penjelasan yang lebih jelas jika tidak memahami perintah
Reasoning : memahami instruksi yang kompleks dan membaginya menjadi langkah-langkah yang dapat dijalankan
- Memahami hubungan dan fungsi antar elemen web
- Menunjukkan proses perencanaan dan eksekusi tugas secara transparan sehingga pengguna dapat memahami proses pengambilan keputusan
Saat ini hanya tersedia untuk kelompok uji tepercaya berskala kecil : jika ingin ikut serta dalam pengujian, perlu mendaftar ke daftar tunggu

1 komentar

iolothebard 2024-12-18

Browser headless yang dioptimalkan untuk AI mulai bermunculan…
server web memberikan respons yang dioptimalkan untuk browser itu…
hari ketika mereka(?) saling berbicara tampaknya tidak lama lagi…

Project Mariner dari Google DeepMind - alat otomatisasi browser

Bacaan terkait

1 komentar