Gemma Gem - Ekstensi Chrome untuk Menjalankan Model Google Gemma 4 Sepenuhnya On-device di Browser

xguru · 2026-04-18T09:31:02+09:00

Menjalankan model Gemma 4 dari Google sepenuhnya on-device berbasis WebGPU, sehingga bisa dimanfaatkan sebagai asisten AI pribadi yang selalu aktif di dalam browser Tanpa API key, cloud, atau pengiriman data eksternal - seluruh inferensi diproses secara lokal dan data tidak pernah keluar dari perangkat Mendukung perilaku agentik untuk membaca halaman yang sedang dikunjungi, mengklik tombol, mengisi formulir, menjalankan JavaScript, dan melakukan tanya jawab tentang situs Tersedia dua pilihan model: Gemma 4 E2B (~500MB) / E4B (~1.5GB), dan akan di-cache setelah dijalankan pertama kali untuk digunakan kembali Mendukung kuantisasi q4f16 dan konteks 128K (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX) Menyediakan 6 alat bawaan read_page_content: membaca teks/HTML halaman atau berdasarkan CSS selector take_screenshot: menangkap halaman yang terlihat sebagai PNG click_element / type_text / scroll_page: manipulasi DOM berbasis CSS selector run_javascript: menjalankan JS dengan akses penuh ke seluruh DOM dalam konteks halaman Arsitektur 3 lapis Offscreen Document + Service Worker + Content Script Offscreen document meng-host model dengan @huggingface/transformers + WebGPU dan menjalankan agent loop Service worker menangani perutean pesan serta pengambilan screenshot dan eksekusi JS Content script menyuntikkan ikon gem dan overlay chat shadow DOM Di pengaturan tersedia dukungan untuk pergantian model, toggle Thinking, batas atas tool-calling loop, reset riwayat percakapan, dan penonaktifan per situs Direktori agent/ tanpa dependensi, dan dapat dijadikan pustaka independen berbasis antarmuka ModelBackend dan ToolExecutor Memerlukan Chrome dengan dukungan WebGPU / lisensi Apache-2.0 / diimplementasikan berbasis TypeScript

(github.com/kessler)

18 poin oleh xguru 2026-04-18 | Belum ada komentar. | Bagikan ke WhatsApp

Menjalankan model Gemma 4 dari Google sepenuhnya on-device berbasis WebGPU, sehingga bisa dimanfaatkan sebagai asisten AI pribadi yang selalu aktif di dalam browser
Tanpa API key, cloud, atau pengiriman data eksternal - seluruh inferensi diproses secara lokal dan data tidak pernah keluar dari perangkat
Mendukung perilaku agentik untuk membaca halaman yang sedang dikunjungi, mengklik tombol, mengisi formulir, menjalankan JavaScript, dan melakukan tanya jawab tentang situs
Tersedia dua pilihan model: Gemma 4 E2B (~500MB) / E4B (~1.5GB), dan akan di-cache setelah dijalankan pertama kali untuk digunakan kembali
Mendukung kuantisasi q4f16 dan konteks 128K (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
Menyediakan 6 alat bawaan
- read_page_content: membaca teks/HTML halaman atau berdasarkan CSS selector
- take_screenshot: menangkap halaman yang terlihat sebagai PNG
- click_element / type_text / scroll_page: manipulasi DOM berbasis CSS selector
- run_javascript: menjalankan JS dengan akses penuh ke seluruh DOM dalam konteks halaman
Arsitektur 3 lapis Offscreen Document + Service Worker + Content Script
- Offscreen document meng-host model dengan @huggingface/transformers + WebGPU dan menjalankan agent loop
- Service worker menangani perutean pesan serta pengambilan screenshot dan eksekusi JS
- Content script menyuntikkan ikon gem dan overlay chat shadow DOM
Di pengaturan tersedia dukungan untuk pergantian model, toggle Thinking, batas atas tool-calling loop, reset riwayat percakapan, dan penonaktifan per situs
Direktori agent/ tanpa dependensi, dan dapat dijadikan pustaka independen berbasis antarmuka ModelBackend dan ToolExecutor
Memerlukan Chrome dengan dukungan WebGPU / lisensi Apache-2.0 / diimplementasikan berbasis TypeScript

Gemma Gem - Ekstensi Chrome untuk Menjalankan Model Google Gemma 4 Sepenuhnya On-device di Browser

Bacaan terkait

Belum ada komentar.