- Gemini 3 Flash adalah model AI terbaru Google yang menghadirkan kecerdasan kelas frontier dengan kecepatan tinggi dan biaya rendah
- Mendukung tugas sehari-hari dan alur kerja agentic dengan menggabungkan kemampuan penalaran setara Gemini 3 Pro dan latensi serta efisiensi seri Flash
- Melampaui Gemini 2.5 Pro pada benchmark utama seperti GPQA Diamond 90.4%, Humanity’s Last Exam 33.7%, dan MMMU Pro 81.2%
- Developer dapat mengaksesnya melalui Google AI Studio, Gemini CLI, Antigravity, Vertex AI dan lainnya, sementara pengguna umum dapat memakainya gratis lewat aplikasi Gemini dan mode AI di Search
- Mendefinisikan ulang keseimbangan antara kecepatan, biaya, dan kecerdasan, serta memposisikan diri sebagai model yang dapat diskalakan baik untuk pengguna berskala besar maupun lingkungan enterprise
Ringkasan Gemini 3 Flash
- Gemini 3 Flash adalah versi perluasan dari keluarga model Gemini 3, model generasi berikutnya yang memaksimalkan kecepatan dan efisiensi
- Dirilis setelah Gemini 3 Pro dan mode Deep Think, dan kini memproses lebih dari 1 triliun token per hari melalui API
- Berbagai use case telah dilaporkan, termasuk pembelajaran topik kompleks, perancangan game interaktif, dan pemahaman konten multimodal
- Tetap mempertahankan penalaran tingkat lanjut, pemahaman visi, dan kemampuan coding agentic Gemini 3, sambil menggabungkannya dengan latensi dan efisiensi biaya tingkat Flash
- Dirancang sebagai model yang dioptimalkan untuk peningkatan akurasi pada tugas sehari-hari dan alur kerja agentic
Performa dan benchmark
- Gemini 3 Flash membuktikan bahwa kecepatan dan skala tidak harus mengorbankan kecerdasan
- Dengan GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% (tanpa penggunaan alat), dan MMMU Pro 81.2%, model ini menunjukkan performa setara model besar
- Mencatat hasil yang lebih unggul dibanding Gemini 2.5 Pro di banyak benchmark
- Memperluas Pareto frontier kualitas, biaya, dan kecepatan
- Untuk tugas kompleks, model ini berpikir lebih lama, tetapi tetap mempertahankan performa tinggi dengan rata-rata penggunaan token 30% lebih sedikit pada traffic umum
- Berdasarkan Artificial Analysis, kecepatan pemrosesannya 3 kali lebih cepat daripada 2.5 Pro, dengan biaya $0.50 per 1 juta token input dan $3.00 untuk output
- Untuk input audio, biayanya $1.00 per 1 juta token
Fitur untuk developer
- Menyediakan performa coding berlatensi rendah yang cocok untuk pengembangan iteratif dan alur kerja berfrekuensi tinggi
- Pada benchmark SWE-bench Verified, meraih skor 78%, melampaui seri 2.5 maupun Gemini 3 Pro
- Kuat untuk tugas multimodal kompleks seperti analisis video, ekstraksi data, dan visual question answering
- Mendukung implementasi aplikasi cerdas seperti bantuan game real-time, A/B testing, dan otomatisasi desain
- Sudah diadopsi oleh perusahaan seperti JetBrains, Bridgewater Associates, dan Figma, serta tersedia melalui Vertex AI dan Gemini Enterprise
Fitur untuk pengguna umum
- Menjadi model default di aplikasi Gemini, menggantikan 2.5 Flash, dan tersedia gratis bagi pengguna di seluruh dunia
- Memperkuat kemampuan penalaran multimodal, seperti membuat rencana yang dapat ditindaklanjuti melalui analisis video dan gambar
- Contoh: analisis ayunan golf, pengenalan gambar, dan pembuatan kuis kustom berbasis audio
- Memungkinkan pembuatan prototipe aplikasi hanya dengan perintah suara, sehingga pengguna non-teknis pun bisa membuat aplikasi dengan cepat
- Juga diterapkan sebagai model default di mode AI pada Search
- Berdasarkan kemampuan penalaran Gemini 3 Pro, model ini menganalisis konteks pertanyaan secara rinci dan memberikan jawaban yang ditata secara visual serta informasi real-time
- Unggul dalam menangani tujuan multilangkah seperti perencanaan perjalanan kompleks atau mempelajari konsep pendidikan
Jalur akses dan distribusi
- Untuk developer: tersedia dalam bentuk preview di Google AI Studio, Gemini CLI, Antigravity, Vertex AI, dan Gemini Enterprise
- Untuk pengguna umum: peluncuran global bertahap melalui aplikasi Gemini dan mode AI di Google Search
- Gemini 3 Flash memperluas posisinya sebagai pilar utama keluarga model Gemini 3 bersama Gemini 3 Pro dan Deep Think
1 komentar
Pendapat Hacker News
Jangan terkecoh dengan nama “Flash”. Model ini benar-benar menunjukkan performa yang luar biasa
Saya sudah memakainya selama beberapa minggu, dan kecepatannya tinggi sekaligus cakupan pengetahuannya luas, jadi jauh lebih efisien dibanding Claude Opus 4.5 atau GPT 5.2 Extra High. Waktu dan biaya inferensinya hampir hanya sepersepuluhnya
Waktu responsnya tetap sama, tetapi hasilnya jauh lebih baik. Rasio harga terhadap performanya gila
Saya penasaran perbedaan teknis apa antara model Pro dan Flash yang membuat Google bisa mencapai performa seperti ini
Sebagai referensi, saya cukup sering memakai Gemini API, jadi setiap kali model baru keluar saya ingin mengujinya lewat benchmark internal
Tapi Gemini 3 Flash adalah model pertama yang memberikan jawaban yang hampir benar untuk pertanyaan benchmark spesifik yang saya punya
Sampelnya memang masih sedikit, tetapi peningkatan akurasi terlihat jelas
Strategi mencoba menyelesaikan semuanya hanya dengan GPT 5 adalah kegagalan.
Saat ini saya sedang menguji Gemini 3 Flash, dan dari sisi latensi maupun performa hasilnya lebih baik daripada GPT 5 Thinking
OpenAI perlu fokus pada pengembangan model yang praktis, bukan iklan
Hasil detailnya bisa dilihat di halaman evaluasi Artificial Analysis
Rilisan kali ini bagus karena bisa langsung dipakai di production tanpa preview terlebih dahulu
Tetapi kenaikan harga terus berlanjut
Misalnya, Gemini 1.5 Flash naik dari input $0.075/M → 3.0 Flash sampai $0.50/M
Model Pro berada di kisaran input $2/M, output $12/M
Koreksi: model kali ini juga versi preview
Untuk sebagian besar pekerjaan non-coding, perbedaan antara Flash dan Flash Lite mungkin lebih penting daripada dibandingkan Pro
Tapi persaingannya ketat, jadi kemungkinan model murah dengan performa serupa akan segera muncul
Rasanya Google benar-benar berhasil menyeimbangkan kecepatan, harga, dan kualitas sekaligus
Jika ditambah integrasi Android dan G Suite, kombinasinya sangat kuat
Mungkin ini strategi untuk meluncurkan smartphone AI-first lebih dulu daripada proyek hardware OpenAI–Jony Ive atau Apple Intelligence
Misalnya, Gemini 3 Pro lambat dan sering gagal bahkan untuk pemanggilan tool
Edityang sederhanaPekerjaan yang sama bisa diselesaikan Claude-Code dalam 5 menit, sedangkan Gemini butuh 27 menit
Saya justru merasa tablet atau kacamata pintar lebih cocok untuk memanfaatkan smol AI
Gemini 3 Flash (non-thinking) adalah model pertama yang mencetak 50% dalam “tes jumlah kaki anjing” saya
Saat ditunjukkan gambar sintetis dengan 5 kaki, kebanyakan model menjawab 4, tetapi 3 Flash menjawab benar: 5
Hanya ketika saya menambahkan tato pada kaki-kakinya model itu bisa menghitung dengan tepat, sedangkan gambar tanpa tato masih dijawab 4
Rasanya layak diberi nilai setengah
Model Flash memang makin mahal, tetapi 3.0 Flash kali ini value for money-nya gila
Di benchmark, model ini mencetak skor 78% dan melampaui seluruh seri 2.5 maupun 3 Pro
Model ini ideal untuk coding berbasis agen dan aplikasi interaktif real-time
Bagi pengguna 2.5 Flash, upgrade ini mungkin terasa lebih mahal, tetapi tetap sepadan
Kalau mau yang murah, masih ada Flash Lite, jadi keseimbangannya tetap ada
Cepat, cerdas, dan juga mendukung konteks 1M
Saya berharap model open-weight bisa ikut bersaing di area ini
Saya sudah merasa kombinasi Claude Code dan Gemini saja sudah mencapai tingkat “cukup bagus”
Sekarang akan sulit bagi perusahaan lain untuk meyakinkan saya.
Dengan rilisan ini, kita sampai pada titik perpotongan antara “cukup bagus dan cukup murah”
Di CLI atau plugin IDE, saya hanya perlu mengubah pilihan model
Akurasinya terlalu tidak konsisten
Perusahaan mungkin menginginkan kecerdasan tanpa batas, tetapi bagi individu sebenarnya tidak perlu sampai sejauh itu
Di benchmark SimpleQA, model ini mencetak 69%, dan itu adalah tes pengetahuan yang sangat langka
Mengingat Gemini 2.5 Pro hanya 55%, ini skor yang luar biasa
Google tampaknya sangat berhasil memanfaatkan kompresi pengetahuan atau arsitektur MoE (Mixture of Experts)
Saya kurang paham perbedaan antara ‘Thinking’ dan ‘Pro’ di Gemini 3
Deskripsinya berbunyi “pemecahan masalah kompleks” vs “pemikiran jangka panjang untuk matematika dan kode tingkat lanjut”
Mungkin bedanya ada pada thinking budget
thinking_levelGemini selalu hanya melakukan pemikiran berbasis kueri.
Jika ditambah loop dan konteks berkelanjutan, mungkin akan terlihat seperti AGI, tetapi biayanya jadi besar
Google kemungkinan besar juga sudah mencoba eksperimen seperti ini
Keluhan utama saya adalah tidak adanya fitur hapus percakapan
Pada akun bisnis, percakapan individual tidak bisa dihapus, dan yang bisa diatur hanya masa retensi keseluruhan (minimal 3 bulan)
Sebagai pengguna berbayar, terasa bahwa fitur dasarnya kurang meski tarifnya terus naik
Untuk perbandingan harga cepat, menurut LLM Prices,
Gemini 3 Flash berharga 1/4 dari Pro ≤200k, dan 1/8 dari Pro >200k
Fakta bahwa harganya tidak naik bahkan setelah 200k token cukup mengesankan
Untuk input, harganya dua kali GPT-5 Mini dan setengah dari Claude 4.5 Haiku