8 poin oleh xguru 2024-12-18 | 1 komentar | Bagikan ke WhatsApp
  • Cara baru menggunakan browser
  • Mengotomatiskan tugas di browser dengan memanfaatkan kemampuan pemahaman dan penalaran multimodal yang kuat berbasis Gemini 2.0
  • Memahami dan menalar semua elemen seperti piksel, teks, kode, gambar, formulir, dan lainnya di layar browser
  • Native Multimodality : memahami dan menalar semua konten di browser
    • Menganalisis elemen kompleks seperti teks, kode, dan gambar di situs web
    • Merespons perintah suara dan memberikan umpan balik visual tentang progres pekerjaan
  • Browser Interaction : memahami dan menavigasi situs web yang kompleks secara real-time
    • Berinteraksi dengan situs web atas nama pengguna
    • Mengotomatiskan tugas berulang untuk menghemat waktu
    • Meminta penjelasan yang lebih jelas jika tidak memahami perintah
  • Reasoning : memahami instruksi yang kompleks dan membaginya menjadi langkah-langkah yang dapat dijalankan
    • Memahami hubungan dan fungsi antar elemen web
    • Menunjukkan proses perencanaan dan eksekusi tugas secara transparan sehingga pengguna dapat memahami proses pengambilan keputusan
  • Saat ini hanya tersedia untuk kelompok uji tepercaya berskala kecil : jika ingin ikut serta dalam pengujian, perlu mendaftar ke daftar tunggu

1 komentar

 
iolothebard 2024-12-18

Browser headless yang dioptimalkan untuk AI mulai bermunculan…
server web memberikan respons yang dioptimalkan untuk browser itu…
hari ketika mereka(?) saling berbicara tampaknya tidak lama lagi…