Google AI Edge Gallery - aplikasi galeri LLM sepenuhnya offline open source
(github.com/google-ai-edge)- Aplikasi iOS/Android yang dioptimalkan untuk menjalankan AI generatif di perangkat, sehingga LLM bisa dijalankan dalam lingkungan sepenuhnya offline dan privat tanpa koneksi internet
- Dukungan resmi untuk keluarga Gemma 4 ditambahkan — memungkinkan pengujian kemampuan penalaran, logika, dan kreasi tingkat lanjut tanpa pengiriman ke server
- Agent Skills: melampaui percakapan dengan LLM untuk menjadikannya asisten yang proaktif
- Memperluas kemampuan LLM dengan alat seperti pencarian fakta Wikipedia, peta interaktif, dan kartu ringkasan visual
- Mendukung pemuatan skill modular dari URL dan penelusuran skill komunitas di GitHub Discussions
- Thinking Mode: memungkinkan melihat secara visual proses penalaran model langkah demi langkah saat chat AI berlangsung (saat ini terbatas pada model yang didukung seperti keluarga Gemma 4)
- Ask Image: pengenalan objek multimodal, teka-teki visual, dan pembuatan deskripsi detail dengan memanfaatkan kamera dan galeri foto
- Audio Scribe: transkripsi dan terjemahan suara secara real-time dengan model di perangkat
- Prompt Lab: workspace khusus untuk menguji prompt sambil menyesuaikan parameter seperti temperature dan top-k secara rinci
- Mobile Actions : otomatisasi kontrol perangkat offline berbasis model fine-tuning FunctionGemma 270m
- Tiny Garden : mini game bahasa alami
- Model Management & Benchmark: mendukung pengunduhan model open source, pemuatan model kustom, dan pengujian benchmark per perangkat keras
- LiteRT runtime ringan + integrasi Hugging Face untuk penjelajahan model dan eksekusi optimalisasi
- Mendukung Android 12+, iOS 17+ / dapat diinstal dari Google Play , App Store / untuk lingkungan tanpa akses Google Play, APK juga dapat diinstal langsung dari rilis GitHub
- Lisensi: Apache-2.0 / Bahasa pengembangan: Kotlin
2 komentar
https://github.com/google-ai-edge/gallery/issues/437
Sepertinya kompatibilitas Exynos kurang baik. Di Galaxy Quantum 5 (A55), ada masalah yang membuatnya menjawab dengan mengulang karakter Tionghoa tanpa henti.
Komentar Hacker News
Model ini benar-benar mengesankan. Saat ini saya menjalankannya di Mac, jadi sekarang bisa berjalan secara lokal juga di iPhone membuat saya ingin mencobanya
Saya sempat mencoba dealignment (melepas sensor) model ini dengan skrip heretic, dan hasilnya benar-benar bagus. Saya bahkan membuat repo gemma4-heretical sendiri untuk merapikannya
Bisa juga dibuat versi MLX, yang sedikit lebih cepat di Mac, tetapi tidak berjalan di Ollama (mungkin bisa di LM Studio)
Di M4 Macbook Pro 128GB berjalan sangat baik, dan kemungkinan besar 64GB juga cukup lancar. Jika memorinya lebih kecil, tahap kuantisasi perlu diturunkan
Saya suka model lokal yang tidak diselaraskan seperti ini. Daripada disensor oleh platform eksternal, saya bisa bereksperimen dengan bebas di perangkat saya sendiri. Jadi memungkinkan percakapan yang “sensitif tetapi produktif”
Saya sempat mencoba menghubungkannya ke OpenClaw tetapi mengalami masalah. Tentu pendekatan seperti ini bisa disalahgunakan, tetapi saya rasa jumlah pengguna yang berniat baik jauh lebih banyak
Aplikasi ini keren, tetapi belum benar-benar menunjukkan seluruh potensi model E2B
Saya membuat AI audio dan video real-time dengan Gemma E2B di M3 Pro, lalu mempostingnya di /r/LocalLLaMA dengan nama Parlor. Responsnya cukup bagus
Saya menjalankannya di Macbook, tetapi menurut benchmark ini, iPhone 17 Pro juga seharusnya sanggup
Saya mencoba menjalankan model di iPhone dan hasilnya lumayan bagus. Memang masih kalah dari Gemini di cloud, tetapi tetap cukup berguna
Fitur “mobile actions” memungkinkan kontrol perangkat seperti menyalakan senter atau membuka peta, jadi cukup menarik. Akan sangat bagus jika terintegrasi dengan Siri Shortcuts
Dari sudut pandang pembuat aplikasi untuk guru, saya sangat senang melihat model lokal makin umum. Karena regulasi privasi, eksekusi di sisi klien itu penting. iOS dan Chrome juga punya API model on-device, tetapi kualitasnya masih rendah
Saya rasa masa depan AI yang realistis hanya ada dua — berjalan gratis secara lokal di perangkat, atau layanan cloud berbiaya tinggi
Opsi kedua hanya akan dipakai untuk pekerjaan yang bagi manusia lebih mahal atau lebih lambat. Model Gemma 4 menunjukkan kemungkinan Siri masa depan yang terintegrasi dengan iPhone dan macOS, semacam asisten seperti di film “Her”
Saya membagikan tautan aplikasi versi bahasa Inggris
Google AI Edge Gallery untuk iOS
Versi Android
Ini adalah aplikasi demo untuk proyek Edge milik Google
Sebagian besar model masih belum bisa diunduh. Semoga segera dirilis
Ada yang mempertanyakan apakah halaman web App Store ini terlihat palsu. Teks header tampak berpiksel, latar belakang berkedip, dan kualitas ikonnya juga rendah
Saya menguji model Gemma-4-E2B-it di iPhone 16 Pro dan mendapatkan sekitar 30 token per detik. Ponselnya memang menjadi cukup panas, tetapi performanya mengesankan. Saya berencana menerapkannya juga ke aplikasi saya
Anak saya mulai memakai model 2B di Android. Di ponsel Motorola murah pun berjalan baik, dan dia memakainya untuk latihan membaca dan menulis bahasa asing. Ringannya model ini benar-benar mengejutkan
Model-model baru ini sangat mengesankan. AI Edge Gallery berjalan di GPU, tetapi NPU pada chip terbaru jauh lebih cepat
Misalnya, chip A16 punya Neural Engine 35 TOPS, sedangkan GPU-nya ada di kisaran 7 TFLOPS. Qualcomm juga kurang lebih sama