4 poin oleh GN⁺ 2025-12-18 | 1 komentar | Bagikan ke WhatsApp
  • Gemini 3 Flash adalah model AI terbaru Google yang menghadirkan kecerdasan kelas frontier dengan kecepatan tinggi dan biaya rendah
  • Mendukung tugas sehari-hari dan alur kerja agentic dengan menggabungkan kemampuan penalaran setara Gemini 3 Pro dan latensi serta efisiensi seri Flash
  • Melampaui Gemini 2.5 Pro pada benchmark utama seperti GPQA Diamond 90.4%, Humanity’s Last Exam 33.7%, dan MMMU Pro 81.2%
  • Developer dapat mengaksesnya melalui Google AI Studio, Gemini CLI, Antigravity, Vertex AI dan lainnya, sementara pengguna umum dapat memakainya gratis lewat aplikasi Gemini dan mode AI di Search
  • Mendefinisikan ulang keseimbangan antara kecepatan, biaya, dan kecerdasan, serta memposisikan diri sebagai model yang dapat diskalakan baik untuk pengguna berskala besar maupun lingkungan enterprise

Ringkasan Gemini 3 Flash

  • Gemini 3 Flash adalah versi perluasan dari keluarga model Gemini 3, model generasi berikutnya yang memaksimalkan kecepatan dan efisiensi
    • Dirilis setelah Gemini 3 Pro dan mode Deep Think, dan kini memproses lebih dari 1 triliun token per hari melalui API
    • Berbagai use case telah dilaporkan, termasuk pembelajaran topik kompleks, perancangan game interaktif, dan pemahaman konten multimodal
  • Tetap mempertahankan penalaran tingkat lanjut, pemahaman visi, dan kemampuan coding agentic Gemini 3, sambil menggabungkannya dengan latensi dan efisiensi biaya tingkat Flash
  • Dirancang sebagai model yang dioptimalkan untuk peningkatan akurasi pada tugas sehari-hari dan alur kerja agentic

Performa dan benchmark

  • Gemini 3 Flash membuktikan bahwa kecepatan dan skala tidak harus mengorbankan kecerdasan
    • Dengan GPQA Diamond 90.4%, Humanity’s Last Exam 33.7% (tanpa penggunaan alat), dan MMMU Pro 81.2%, model ini menunjukkan performa setara model besar
    • Mencatat hasil yang lebih unggul dibanding Gemini 2.5 Pro di banyak benchmark
  • Memperluas Pareto frontier kualitas, biaya, dan kecepatan
    • Untuk tugas kompleks, model ini berpikir lebih lama, tetapi tetap mempertahankan performa tinggi dengan rata-rata penggunaan token 30% lebih sedikit pada traffic umum
    Iklan
  • Berdasarkan Artificial Analysis, kecepatan pemrosesannya 3 kali lebih cepat daripada 2.5 Pro, dengan biaya $0.50 per 1 juta token input dan $3.00 untuk output
    • Untuk input audio, biayanya $1.00 per 1 juta token

Fitur untuk developer

  • Menyediakan performa coding berlatensi rendah yang cocok untuk pengembangan iteratif dan alur kerja berfrekuensi tinggi
    • Pada benchmark SWE-bench Verified, meraih skor 78%, melampaui seri 2.5 maupun Gemini 3 Pro
  • Kuat untuk tugas multimodal kompleks seperti analisis video, ekstraksi data, dan visual question answering
    • Mendukung implementasi aplikasi cerdas seperti bantuan game real-time, A/B testing, dan otomatisasi desain
    Iklan
  • Sudah diadopsi oleh perusahaan seperti JetBrains, Bridgewater Associates, dan Figma, serta tersedia melalui Vertex AI dan Gemini Enterprise

Fitur untuk pengguna umum

  • Menjadi model default di aplikasi Gemini, menggantikan 2.5 Flash, dan tersedia gratis bagi pengguna di seluruh dunia
    • Memperkuat kemampuan penalaran multimodal, seperti membuat rencana yang dapat ditindaklanjuti melalui analisis video dan gambar
    • Contoh: analisis ayunan golf, pengenalan gambar, dan pembuatan kuis kustom berbasis audio
  • Memungkinkan pembuatan prototipe aplikasi hanya dengan perintah suara, sehingga pengguna non-teknis pun bisa membuat aplikasi dengan cepat
  • Juga diterapkan sebagai model default di mode AI pada Search
    • Berdasarkan kemampuan penalaran Gemini 3 Pro, model ini menganalisis konteks pertanyaan secara rinci dan memberikan jawaban yang ditata secara visual serta informasi real-time
    • Unggul dalam menangani tujuan multilangkah seperti perencanaan perjalanan kompleks atau mempelajari konsep pendidikan

Jalur akses dan distribusi

  • Untuk developer: tersedia dalam bentuk preview di Google AI Studio, Gemini CLI, Antigravity, Vertex AI, dan Gemini Enterprise
  • Untuk pengguna umum: peluncuran global bertahap melalui aplikasi Gemini dan mode AI di Google Search
  • Gemini 3 Flash memperluas posisinya sebagai pilar utama keluarga model Gemini 3 bersama Gemini 3 Pro dan Deep Think

1 komentar

 
GN⁺ 2025-12-18
Pendapat Hacker News
  • Jangan terkecoh dengan nama “Flash”. Model ini benar-benar menunjukkan performa yang luar biasa
    Saya sudah memakainya selama beberapa minggu, dan kecepatannya tinggi sekaligus cakupan pengetahuannya luas, jadi jauh lebih efisien dibanding Claude Opus 4.5 atau GPT 5.2 Extra High. Waktu dan biaya inferensinya hampir hanya sepersepuluhnya

    • Saya juga sudah menjalankan benchmark, dan di antara 2.5 Flash, 2.5 Pro, dan 3.0 Flash, 3.0 Flash yang paling bagus
      Waktu responsnya tetap sama, tetapi hasilnya jauh lebih baik. Rasio harga terhadap performanya gila
      Saya penasaran perbedaan teknis apa antara model Pro dan Flash yang membuat Google bisa mencapai performa seperti ini
      Sebagai referensi, saya cukup sering memakai Gemini API, jadi setiap kali model baru keluar saya ingin mengujinya lewat benchmark internal
    • Saya termasuk skeptis terhadap GenAI. Saya sering menguji topik yang kompleks atau niche, dan kebanyakan model memberi jawaban yang kacau
      Tapi Gemini 3 Flash adalah model pertama yang memberikan jawaban yang hampir benar untuk pertanyaan benchmark spesifik yang saya punya
      Sampelnya memang masih sedikit, tetapi peningkatan akurasi terlihat jelas
    • Saya rasa OpenAI membuat kesalahan besar dengan mengabaikan model inferensi cepat
      Strategi mencoba menyelesaikan semuanya hanya dengan GPT 5 adalah kegagalan.
      Saat ini saya sedang menguji Gemini 3 Flash, dan dari sisi latensi maupun performa hasilnya lebih baik daripada GPT 5 Thinking
      OpenAI perlu fokus pada pengembangan model yang praktis, bukan iklan
    • Jika melihat benchmark, Flash memang lemah pada aspek halusinasi (hallucination), tetapi secara keseluruhan lebih unggul daripada Gemini 3 Pro atau GPT 5.1 Thinking
      Hasil detailnya bisa dilihat di halaman evaluasi Artificial Analysis
    • Bisa jadi akan datang saatnya perusahaan-perusahaan yang terlalu banyak berinvestasi di OpenAI menyesal. Nvidia mungkin pengecualian, tetapi Microsoft tampaknya akan kurang peduli karena mereka menjual model lewat Azure
  • Rilisan kali ini bagus karena bisa langsung dipakai di production tanpa preview terlebih dahulu
    Tetapi kenaikan harga terus berlanjut
    Misalnya, Gemini 1.5 Flash naik dari input $0.075/M → 3.0 Flash sampai $0.50/M
    Model Pro berada di kisaran input $2/M, output $12/M
    Koreksi: model kali ini juga versi preview

    • Saya justru lebih penasaran dengan performa dan harga Gemini 3 Flash Lite saat nanti keluar
      Untuk sebagian besar pekerjaan non-coding, perbedaan antara Flash dan Flash Lite mungkin lebih penting daripada dibandingkan Pro
    • Terima kasih sudah merangkum harganya. Performa Gemini 3.0 memang sangat bagus, jadi sepertinya mereka cukup percaya diri dengan kebijakan harga ini
      Tapi persaingannya ketat, jadi kemungkinan model murah dengan performa serupa akan segera muncul
    • Jika mode Thinking diaktifkan, penggunaan token akan berubah, jadi itu perlu diperhitungkan saat menghitung biaya sebenarnya
    • GPT-5 Mini harganya input $0.25/M, output $2/M, jadi dibanding Flash, inputnya setengah harga dan outputnya 50% lebih murah
  • Rasanya Google benar-benar berhasil menyeimbangkan kecepatan, harga, dan kualitas sekaligus
    Jika ditambah integrasi Android dan G Suite, kombinasinya sangat kuat
    Mungkin ini strategi untuk meluncurkan smartphone AI-first lebih dulu daripada proyek hardware OpenAI–Jony Ive atau Apple Intelligence

    • Tetapi dalam penggunaan nyata hasilnya bisa berbeda tergantung kasusnya.
      Misalnya, Gemini 3 Pro lambat dan sering gagal bahkan untuk pemanggilan tool Edit yang sederhana
      Pekerjaan yang sama bisa diselesaikan Claude-Code dalam 5 menit, sedangkan Gemini butuh 27 menit
    • Menurut artikel MacRumors, Apple Intelligence direncanakan akan berbasis Gemini
    • Tapi saya masih bertanya-tanya AI di smartphone sebenarnya mau dipakai untuk apa.
      Saya justru merasa tablet atau kacamata pintar lebih cocok untuk memanfaatkan smol AI
  • Gemini 3 Flash (non-thinking) adalah model pertama yang mencetak 50% dalam “tes jumlah kaki anjing” saya
    Saat ditunjukkan gambar sintetis dengan 5 kaki, kebanyakan model menjawab 4, tetapi 3 Flash menjawab benar: 5
    Hanya ketika saya menambahkan tato pada kaki-kakinya model itu bisa menghitung dengan tepat, sedangkan gambar tanpa tato masih dijawab 4
    Rasanya layak diberi nilai setengah

  • Model Flash memang makin mahal, tetapi 3.0 Flash kali ini value for money-nya gila
    Di benchmark, model ini mencetak skor 78% dan melampaui seluruh seri 2.5 maupun 3 Pro
    Model ini ideal untuk coding berbasis agen dan aplikasi interaktif real-time

    • 3.0 Flash lebih murah, lebih cepat, dan performanya lebih baik daripada 2.5 Pro
      Bagi pengguna 2.5 Flash, upgrade ini mungkin terasa lebih mahal, tetapi tetap sepadan
    • Menurut saya memosisikan Flash semakin jelas sebagai model yang fokus pada coding dan penalaran adalah arah yang bagus
      Kalau mau yang murah, masih ada Flash Lite, jadi keseimbangannya tetap ada
    • Nemotron 3 Nano dari Nvidia bisa menjadi alternatif OSS yang mirip
      Cepat, cerdas, dan juga mendukung konteks 1M
    • Dalam benchmark aplikasi saya, hanya Gemini Flash dan Grok 4 Fast yang benar-benar layak dipakai
      Saya berharap model open-weight bisa ikut bersaing di area ini
    • Berdasarkan benchmark Epoch.ai, model ini juga lebih unggul daripada GPT 5.2 milik OpenAI
  • Saya sudah merasa kombinasi Claude Code dan Gemini saja sudah mencapai tingkat “cukup bagus”
    Sekarang akan sulit bagi perusahaan lain untuk meyakinkan saya.
    Dengan rilisan ini, kita sampai pada titik perpotongan antara “cukup bagus dan cukup murah

    • Biaya perpindahan saya nyaris tidak ada, jadi saya bisa ganti model dengan mudah
      Di CLI atau plugin IDE, saya hanya perlu mengubah pilihan model
    • Model-model terbaru akhirnya mewujudkan janji coding berbasis agen menjadi kenyataan
    • Model-model lama sering salah sehingga malah membuang waktu
      Akurasinya terlalu tidak konsisten
    • Dengan Opus 4.5, masalah software engineering pada dasarnya sudah berada di level ‘selesai’
      Perusahaan mungkin menginginkan kecerdasan tanpa batas, tetapi bagi individu sebenarnya tidak perlu sampai sejauh itu
  • Di benchmark SimpleQA, model ini mencetak 69%, dan itu adalah tes pengetahuan yang sangat langka
    Mengingat Gemini 2.5 Pro hanya 55%, ini skor yang luar biasa
    Google tampaknya sangat berhasil memanfaatkan kompresi pengetahuan atau arsitektur MoE (Mixture of Experts)

    • Evaluasi Omniscience dari Artificial Analysis juga layak dilihat
    • Berkat arsitektur MoE, mereka mungkin bisa memakai banyak parameter di TPU sambil tetap menjaga throughput
    • Model seperti ini tampaknya juga akan sangat cocok untuk antarmuka suara. Mungkin Apple juga akan mengadopsinya
    • Atau bisa juga model ini secara internal bernalar dengan memanfaatkan pemanggilan tool (misalnya Google Search)
    • Mungkin juga strukturnya meningkatkan sparsity dengan menambah jumlah expert dan menurunkan rasio aktivasi
  • Saya kurang paham perbedaan antara ‘Thinking’ dan ‘Pro’ di Gemini 3
    Deskripsinya berbunyi “pemecahan masalah kompleks” vs “pemikiran jangka panjang untuk matematika dan kode tingkat lanjut”
    Mungkin bedanya ada pada thinking budget

    • Strukturnya tampak seperti Fast = Flash (thinking budget rendah), Thinking = Flash (thinking budget tinggi), Pro = Pro (thinking budget tinggi)
    • Dalam praktiknya, sepertinya ini dikendalikan oleh parameter thinking_level
    • Saya penasaran bagaimana ‘Thinking’ di Gemini berbeda dari AGI
      Gemini selalu hanya melakukan pemikiran berbasis kueri.
      Jika ditambah loop dan konteks berkelanjutan, mungkin akan terlihat seperti AGI, tetapi biayanya jadi besar
      Google kemungkinan besar juga sudah mencoba eksperimen seperti ini
  • Keluhan utama saya adalah tidak adanya fitur hapus percakapan
    Pada akun bisnis, percakapan individual tidak bisa dihapus, dan yang bisa diatur hanya masa retensi keseluruhan (minimal 3 bulan)
    Sebagai pengguna berbayar, terasa bahwa fitur dasarnya kurang meski tarifnya terus naik

    • Jika dipakai lewat API, masalah ini bisa dihindari
    • Baik untuk konsumen maupun enterprise, kontrol retensi data sangat buruk. Di antara pesaing utama, ini yang paling parah
  • Untuk perbandingan harga cepat, menurut LLM Prices,
    Gemini 3 Flash berharga 1/4 dari Pro ≤200k, dan 1/8 dari Pro >200k
    Fakta bahwa harganya tidak naik bahkan setelah 200k token cukup mengesankan
    Untuk input, harganya dua kali GPT-5 Mini dan setengah dari Claude 4.5 Haiku