- Google memperkenalkan versi pratinjau baru Gemini 2.5 Flash dan 2.5 Flash-Lite, dengan fokus utama pada peningkatan kualitas dan efisiensi
- Flash-Lite dioptimalkan untuk lingkungan berkecepatan tinggi dan berbiaya rendah melalui pemahaman instruksi yang lebih baik, pengurangan jawaban yang bertele-tele, serta peningkatan kemampuan multimodal dan terjemahan
- Flash menghadirkan kemampuan penggunaan alat yang lebih kuat dan efisiensi token yang lebih baik, sehingga performanya meningkat besar pada tugas agen yang kompleks
- Dalam pengujian nyata, skor SWE-Bench Verified naik 5%, dan pada benchmark internal performa untuk tugas jangka panjang meningkat 15%
- Kedua model mendukung alias
-latest, sehingga fitur terbaru bisa digunakan tanpa mengubah kode, sementara pengguna yang menginginkan stabilitas tetap dapat memakai model 2.5 yang ada
Gambaran umum Gemini 2.5 Flash dan Flash-Lite
- Versi terbaru Gemini 2.5 Flash dan Flash-Lite telah dirilis di Google AI Studio dan Vertex AI. Tujuan rilis ini adalah untuk terus menghadirkan kualitas model yang lebih baik dan efisiensi yang lebih tinggi
- Flash-Lite dan Flash yang baru menunjukkan peningkatan besar dibanding model sebelumnya dalam kualitas keseluruhan, kecepatan, dan biaya
- Flash-Lite mengurangi token output hingga 50%, dan Flash hingga 24%, sehingga memberikan penghematan biaya operasional dan pemrosesan yang lebih cepat
Updated Gemini 2.5 Flash-Lite
- Peningkatan mengikuti perintah: kemampuan memahami dan menjalankan instruksi kompleks maupun system prompt meningkat signifikan
- Lebih ringkas: menghasilkan respons yang lebih pendek dan mudah dipahami, sehingga menekan biaya token dan mengurangi latensi di lingkungan dengan trafik besar
- Peningkatan kualitas multimodal dan terjemahan: keandalan meningkat pada transkripsi audio, pengenalan gambar, dan kualitas terjemahan
- Versi pratinjau Flash-Lite dapat langsung dicoba dengan nama model
gemini-2.5-flash-lite-preview-09-2025
Updated Gemini 2.5 Flash
- Kemampuan penggunaan alat yang ditingkatkan: kegunaan berbasis agen dalam situasi multistep yang kompleks meningkat pesat, mencapai performa yang naik 5 poin persentase dibanding versi sebelumnya menurut SWE-Bench Verified (48.9% → 54%)
- Efisiensi biaya yang lebih baik: menghadirkan kualitas output lebih tinggi dengan penggunaan token lebih sedikit, sehingga membantu menurunkan latensi dan biaya infrastruktur
- Umpan balik dari pengguna Primer juga positif
- Yichao ‘Peak’ Ji, co-founder dan Chief Scientist Manus, menilai, "Model Gemini 2.5 Flash yang baru menghadirkan kecepatan dan kecerdasan yang luar biasa sekaligus. Pada tugas agen berbasis tujuan jangka panjang, performanya meningkat 15%, sehingga skalanya dapat diperluas lebih jauh dengan efisiensi biaya sebagai fondasi"
- Versi pratinjau Gemini 2.5 Flash tersedia dengan nama model
gemini-2.5-flash-preview-09-2025
Mulai membangun dengan Gemini
- Selama setahun terakhir, model pratinjau telah dirilis agar developer dapat dengan cepat menguji fitur terbaru dan memberikan umpan balik.
- Versi pratinjau yang diumumkan hari ini bukan peralihan resmi ke versi stabil yang baru, melainkan digunakan sebagai dasar untuk meningkatkan kualitas versi resmi berikutnya
- Sebagai pengganti nama model yang panjang, alias
-latest ditambahkan agar model terbaru selalu mudah digunakan. Alias ini otomatis mengarah ke versi terbaru, sehingga fitur baru dapat diuji tanpa mengubah kode
gemini-flash-latest
gemini-flash-lite-latest
- Jika versi tertentu diperbarui atau dihentikan, pemberitahuan akan dikirim melalui email setidaknya 2 minggu sebelumnya. Alias ini hanyalah referensi sederhana, dan harga, fitur, serta batasan dapat berbeda pada tiap rilis
- Jika membutuhkan stabilitas jangka panjang, disarankan tetap menggunakan nama model
gemini-2.5-flash dan gemini-2.5-flash-lite yang ada
Makna pentingnya
- Rilis kali ini adalah pembaruan pratinjau, bukan promosi ke versi stabil resmi, sebagai bagian dari proses eksperimen dan pengumpulan umpan balik pengguna untuk model stabil di masa depan
- Melalui Gemini, Google mengejar keseimbangan antara kecepatan, kecerdasan, dan efisiensi biaya, sambil terus meningkatkan kemampuannya agar developer dapat membangun aplikasi AI yang lebih baik
1 komentar
Komentar Hacker News
application/json, penggunaan tool jadi tidak bisa dilakukan, dan kalau ingin memakai keduanya, pilihannya hanya berharap JSON keluar dengan benar secara paksa (dan ini sering gagal), atau memakai tool di request pertama lalu memformat di request kedua. Merepotkan, tetapi setidaknya jalan memutarnya cukup sederhanaCatatan rilisnya bisa dilihat di sini. Untuk diskusi terkait pelican, lihat posting ini