Gemini 3 Flash: Inteligensi Frontier yang Dirancang untuk Kecepatan

(blog.google)

4 poin oleh GN⁺ 2025-12-18 | 1 komentar | Bagikan ke WhatsApp

Gemini 3 Flash adalah model AI terbaru Google yang menghadirkan kecerdasan kelas frontier dengan kecepatan tinggi dan biaya rendah
Mendukung tugas sehari-hari dan alur kerja agentic dengan menggabungkan kemampuan penalaran setara Gemini 3 Pro dan latensi serta efisiensi seri Flash
Melampaui Gemini 2.5 Pro pada benchmark utama seperti GPQA Diamond 90.4%, Humanity’s Last Exam 33.7%, dan MMMU Pro 81.2%
Developer dapat mengaksesnya melalui Google AI Studio, Gemini CLI, Antigravity, Vertex AI dan lainnya, sementara pengguna umum dapat memakainya gratis lewat aplikasi Gemini dan mode AI di Search
Mendefinisikan ulang keseimbangan antara kecepatan, biaya, dan kecerdasan, serta memposisikan diri sebagai model yang dapat diskalakan baik untuk pengguna berskala besar maupun lingkungan enterprise

Ringkasan Gemini 3 Flash

Gemini 3 Flash adalah versi perluasan dari keluarga model Gemini 3, model generasi berikutnya yang memaksimalkan kecepatan dan efisiensi
- Dirilis setelah Gemini 3 Pro dan mode Deep Think, dan kini memproses lebih dari 1 triliun token per hari melalui API
- Berbagai use case telah dilaporkan, termasuk pembelajaran topik kompleks, perancangan game interaktif, dan pemahaman konten multimodal
Tetap mempertahankan penalaran tingkat lanjut, pemahaman visi, dan kemampuan coding agentic Gemini 3, sambil menggabungkannya dengan latensi dan efisiensi biaya tingkat Flash
Dirancang sebagai model yang dioptimalkan untuk peningkatan akurasi pada tugas sehari-hari dan alur kerja agentic

Performa dan benchmark

Gemini 3 Flash membuktikan bahwa kecepatan dan skala tidak harus mengorbankan kecerdasan
- Dengan GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% (tanpa penggunaan alat), dan MMMU Pro 81.2%, model ini menunjukkan performa setara model besar
- Mencatat hasil yang lebih unggul dibanding Gemini 2.5 Pro di banyak benchmark
Memperluas Pareto frontier kualitas, biaya, dan kecepatan
- Untuk tugas kompleks, model ini berpikir lebih lama, tetapi tetap mempertahankan performa tinggi dengan rata-rata penggunaan token 30% lebih sedikit pada traffic umum
Berdasarkan Artificial Analysis, kecepatan pemrosesannya 3 kali lebih cepat daripada 2.5 Pro, dengan biaya $0.50 per 1 juta token input dan $3.00 untuk output
- Untuk input audio, biayanya $1.00 per 1 juta token

Fitur untuk developer

Menyediakan performa coding berlatensi rendah yang cocok untuk pengembangan iteratif dan alur kerja berfrekuensi tinggi
- Pada benchmark SWE-bench Verified, meraih skor 78%, melampaui seri 2.5 maupun Gemini 3 Pro
Kuat untuk tugas multimodal kompleks seperti analisis video, ekstraksi data, dan visual question answering
- Mendukung implementasi aplikasi cerdas seperti bantuan game real-time, A/B testing, dan otomatisasi desain
Sudah diadopsi oleh perusahaan seperti JetBrains, Bridgewater Associates, dan Figma, serta tersedia melalui Vertex AI dan Gemini Enterprise

Fitur untuk pengguna umum

Menjadi model default di aplikasi Gemini, menggantikan 2.5 Flash, dan tersedia gratis bagi pengguna di seluruh dunia
- Memperkuat kemampuan penalaran multimodal, seperti membuat rencana yang dapat ditindaklanjuti melalui analisis video dan gambar
- Contoh: analisis ayunan golf, pengenalan gambar, dan pembuatan kuis kustom berbasis audio
Memungkinkan pembuatan prototipe aplikasi hanya dengan perintah suara, sehingga pengguna non-teknis pun bisa membuat aplikasi dengan cepat
Juga diterapkan sebagai model default di mode AI pada Search
- Berdasarkan kemampuan penalaran Gemini 3 Pro, model ini menganalisis konteks pertanyaan secara rinci dan memberikan jawaban yang ditata secara visual serta informasi real-time
- Unggul dalam menangani tujuan multilangkah seperti perencanaan perjalanan kompleks atau mempelajari konsep pendidikan

Jalur akses dan distribusi

Untuk developer: tersedia dalam bentuk preview di Google AI Studio, Gemini CLI, Antigravity, Vertex AI, dan Gemini Enterprise
Untuk pengguna umum: peluncuran global bertahap melalui aplikasi Gemini dan mode AI di Google Search
Gemini 3 Flash memperluas posisinya sebagai pilar utama keluarga model Gemini 3 bersama Gemini 3 Pro dan Deep Think

1 komentar

GN⁺ 2025-12-18

Pendapat Hacker News

Jangan terkecoh dengan nama “Flash”. Model ini benar-benar menunjukkan performa yang luar biasa
Saya sudah memakainya selama beberapa minggu, dan kecepatannya tinggi sekaligus cakupan pengetahuannya luas, jadi jauh lebih efisien dibanding Claude Opus 4.5 atau GPT 5.2 Extra High. Waktu dan biaya inferensinya hampir hanya sepersepuluhnya
- Saya juga sudah menjalankan benchmark, dan di antara 2.5 Flash, 2.5 Pro, dan 3.0 Flash, 3.0 Flash yang paling bagus
  Waktu responsnya tetap sama, tetapi hasilnya jauh lebih baik. Rasio harga terhadap performanya gila
  Saya penasaran perbedaan teknis apa antara model Pro dan Flash yang membuat Google bisa mencapai performa seperti ini
  Sebagai referensi, saya cukup sering memakai Gemini API, jadi setiap kali model baru keluar saya ingin mengujinya lewat benchmark internal
- Saya termasuk skeptis terhadap GenAI. Saya sering menguji topik yang kompleks atau niche, dan kebanyakan model memberi jawaban yang kacau
  Tapi Gemini 3 Flash adalah model pertama yang memberikan jawaban yang hampir benar untuk pertanyaan benchmark spesifik yang saya punya
  Sampelnya memang masih sedikit, tetapi peningkatan akurasi terlihat jelas
- Saya rasa OpenAI membuat kesalahan besar dengan mengabaikan model inferensi cepat
  Strategi mencoba menyelesaikan semuanya hanya dengan GPT 5 adalah kegagalan.
  Saat ini saya sedang menguji Gemini 3 Flash, dan dari sisi latensi maupun performa hasilnya lebih baik daripada GPT 5 Thinking
  OpenAI perlu fokus pada pengembangan model yang praktis, bukan iklan
- Jika melihat benchmark, Flash memang lemah pada aspek halusinasi (hallucination), tetapi secara keseluruhan lebih unggul daripada Gemini 3 Pro atau GPT 5.1 Thinking
  Hasil detailnya bisa dilihat di halaman evaluasi Artificial Analysis
- Bisa jadi akan datang saatnya perusahaan-perusahaan yang terlalu banyak berinvestasi di OpenAI menyesal. Nvidia mungkin pengecualian, tetapi Microsoft tampaknya akan kurang peduli karena mereka menjual model lewat Azure
Rilisan kali ini bagus karena bisa langsung dipakai di production tanpa preview terlebih dahulu
Tetapi kenaikan harga terus berlanjut
Misalnya, Gemini 1.5 Flash naik dari input $0.075/M → 3.0 Flash sampai $0.50/M
Model Pro berada di kisaran input $2/M, output $12/M
Koreksi: model kali ini juga versi preview
- Saya justru lebih penasaran dengan performa dan harga Gemini 3 Flash Lite saat nanti keluar
  Untuk sebagian besar pekerjaan non-coding, perbedaan antara Flash dan Flash Lite mungkin lebih penting daripada dibandingkan Pro
- Terima kasih sudah merangkum harganya. Performa Gemini 3.0 memang sangat bagus, jadi sepertinya mereka cukup percaya diri dengan kebijakan harga ini
  Tapi persaingannya ketat, jadi kemungkinan model murah dengan performa serupa akan segera muncul
- Jika mode Thinking diaktifkan, penggunaan token akan berubah, jadi itu perlu diperhitungkan saat menghitung biaya sebenarnya
- GPT-5 Mini harganya input $0.25/M, output $2/M, jadi dibanding Flash, inputnya setengah harga dan outputnya 50% lebih murah
Rasanya Google benar-benar berhasil menyeimbangkan kecepatan, harga, dan kualitas sekaligus
Jika ditambah integrasi Android dan G Suite, kombinasinya sangat kuat
Mungkin ini strategi untuk meluncurkan smartphone AI-first lebih dulu daripada proyek hardware OpenAI–Jony Ive atau Apple Intelligence
- Tetapi dalam penggunaan nyata hasilnya bisa berbeda tergantung kasusnya.
  Misalnya, Gemini 3 Pro lambat dan sering gagal bahkan untuk pemanggilan tool Edit yang sederhana
  Pekerjaan yang sama bisa diselesaikan Claude-Code dalam 5 menit, sedangkan Gemini butuh 27 menit
- Menurut artikel MacRumors, Apple Intelligence direncanakan akan berbasis Gemini
- Tapi saya masih bertanya-tanya AI di smartphone sebenarnya mau dipakai untuk apa.
  Saya justru merasa tablet atau kacamata pintar lebih cocok untuk memanfaatkan smol AI
Gemini 3 Flash (non-thinking) adalah model pertama yang mencetak 50% dalam “tes jumlah kaki anjing” saya
Saat ditunjukkan gambar sintetis dengan 5 kaki, kebanyakan model menjawab 4, tetapi 3 Flash menjawab benar: 5
Hanya ketika saya menambahkan tato pada kaki-kakinya model itu bisa menghitung dengan tepat, sedangkan gambar tanpa tato masih dijawab 4
Rasanya layak diberi nilai setengah
Model Flash memang makin mahal, tetapi 3.0 Flash kali ini value for money-nya gila
Di benchmark, model ini mencetak skor 78% dan melampaui seluruh seri 2.5 maupun 3 Pro
Model ini ideal untuk coding berbasis agen dan aplikasi interaktif real-time
- 3.0 Flash lebih murah, lebih cepat, dan performanya lebih baik daripada 2.5 Pro
  Bagi pengguna 2.5 Flash, upgrade ini mungkin terasa lebih mahal, tetapi tetap sepadan
- Menurut saya memosisikan Flash semakin jelas sebagai model yang fokus pada coding dan penalaran adalah arah yang bagus
  Kalau mau yang murah, masih ada Flash Lite, jadi keseimbangannya tetap ada
- Nemotron 3 Nano dari Nvidia bisa menjadi alternatif OSS yang mirip
  Cepat, cerdas, dan juga mendukung konteks 1M
- Dalam benchmark aplikasi saya, hanya Gemini Flash dan Grok 4 Fast yang benar-benar layak dipakai
  Saya berharap model open-weight bisa ikut bersaing di area ini
- Berdasarkan benchmark Epoch.ai, model ini juga lebih unggul daripada GPT 5.2 milik OpenAI
Saya sudah merasa kombinasi Claude Code dan Gemini saja sudah mencapai tingkat “cukup bagus”
Sekarang akan sulit bagi perusahaan lain untuk meyakinkan saya.
Dengan rilisan ini, kita sampai pada titik perpotongan antara “cukup bagus dan cukup murah”
- Biaya perpindahan saya nyaris tidak ada, jadi saya bisa ganti model dengan mudah
  Di CLI atau plugin IDE, saya hanya perlu mengubah pilihan model
- Model-model terbaru akhirnya mewujudkan janji coding berbasis agen menjadi kenyataan
- Model-model lama sering salah sehingga malah membuang waktu
  Akurasinya terlalu tidak konsisten
- Dengan Opus 4.5, masalah software engineering pada dasarnya sudah berada di level ‘selesai’
  Perusahaan mungkin menginginkan kecerdasan tanpa batas, tetapi bagi individu sebenarnya tidak perlu sampai sejauh itu
Di benchmark SimpleQA, model ini mencetak 69%, dan itu adalah tes pengetahuan yang sangat langka
Mengingat Gemini 2.5 Pro hanya 55%, ini skor yang luar biasa
Google tampaknya sangat berhasil memanfaatkan kompresi pengetahuan atau arsitektur MoE (Mixture of Experts)
- Evaluasi Omniscience dari Artificial Analysis juga layak dilihat
- Berkat arsitektur MoE, mereka mungkin bisa memakai banyak parameter di TPU sambil tetap menjaga throughput
- Model seperti ini tampaknya juga akan sangat cocok untuk antarmuka suara. Mungkin Apple juga akan mengadopsinya
- Atau bisa juga model ini secara internal bernalar dengan memanfaatkan pemanggilan tool (misalnya Google Search)
- Mungkin juga strukturnya meningkatkan sparsity dengan menambah jumlah expert dan menurunkan rasio aktivasi
Saya kurang paham perbedaan antara ‘Thinking’ dan ‘Pro’ di Gemini 3
Deskripsinya berbunyi “pemecahan masalah kompleks” vs “pemikiran jangka panjang untuk matematika dan kode tingkat lanjut”
Mungkin bedanya ada pada thinking budget
- Strukturnya tampak seperti Fast = Flash (thinking budget rendah), Thinking = Flash (thinking budget tinggi), Pro = Pro (thinking budget tinggi)
- Dalam praktiknya, sepertinya ini dikendalikan oleh parameter thinking_level
- Saya penasaran bagaimana ‘Thinking’ di Gemini berbeda dari AGI
  Gemini selalu hanya melakukan pemikiran berbasis kueri.
  Jika ditambah loop dan konteks berkelanjutan, mungkin akan terlihat seperti AGI, tetapi biayanya jadi besar
  Google kemungkinan besar juga sudah mencoba eksperimen seperti ini
Keluhan utama saya adalah tidak adanya fitur hapus percakapan
Pada akun bisnis, percakapan individual tidak bisa dihapus, dan yang bisa diatur hanya masa retensi keseluruhan (minimal 3 bulan)
Sebagai pengguna berbayar, terasa bahwa fitur dasarnya kurang meski tarifnya terus naik
- Jika dipakai lewat API, masalah ini bisa dihindari
- Baik untuk konsumen maupun enterprise, kontrol retensi data sangat buruk. Di antara pesaing utama, ini yang paling parah
Untuk perbandingan harga cepat, menurut LLM Prices,
Gemini 3 Flash berharga 1/4 dari Pro ≤200k, dan 1/8 dari Pro >200k
Fakta bahwa harganya tidak naik bahkan setelah 200k token cukup mengesankan
Untuk input, harganya dua kali GPT-5 Mini dan setengah dari Claude 4.5 Haiku

Gemini 3 Flash: Inteligensi Frontier yang Dirancang untuk Kecepatan

Ringkasan Gemini 3 Flash

Performa dan benchmark

Fitur untuk developer

Fitur untuk pengguna umum

Jalur akses dan distribusi

Bacaan terkait

1 komentar

Pendapat Hacker News