Peluncuran Gemini 2.0
(developers.googleblog.com)Gemini 2.0: model AI generasi berikutnya untuk developer
- Model AI mutakhir yang dikembangkan Google untuk membantu developer membangun masa depan AI.
- Sejak peluncuran Gemini 1.0, jutaan developer telah menggunakan Gemini dalam 109 bahasa melalui Google AI Studio dan Vertex AI.
- Dengan Gemini 2.0 Flash Experimental, kini dimungkinkan membangun aplikasi yang lebih imersif dan interaktif, serta tersedia coding agent baru yang dapat menjalankan tugas atas nama developer.
Gemini 2.0 Flash
- Model yang dibangun di atas kesuksesan Gemini 1.5 Flash, menawarkan performa kuat dengan kecepatan 2x lebih cepat dibanding 1.5 Pro.
- Menyediakan kemampuan output multimodal baru dan penggunaan tool secara native.
- Memperkenalkan Multimodal Live API untuk membangun aplikasi dinamis melalui streaming audio dan video real-time.
- Developer dapat menguji dan mengeksplorasi Gemini 2.0 Flash yang masih dalam tahap eksperimental di Google AI Studio dan Vertex AI, dengan rilis umum dijadwalkan pada awal tahun depan.
Fitur utama:
-
Peningkatan performa:
- Lebih kuat daripada Gemini 1.5 Pro sambil tetap mempertahankan kecepatan dan efisiensi model Flash.
- Peningkatan performa pada multimodal, teks, kode, video, pemahaman spasial, dan penalaran.
- Secara khusus, peningkatan kemampuan pemahaman spasial meningkatkan akurasi pembuatan bounding box untuk objek kecil dalam gambar yang kompleks.
-
Mode output baru:
- Dapat menghasilkan respons terpadu yang mencakup teks, audio, dan gambar melalui satu panggilan API.
- Menerapkan watermark tak terlihat SynthID pada semua output gambar dan audio untuk mengurangi masalah misinformasi dan salah atribusi.
- Output audio native multibahasa: Dapat mengontrol output audio text-to-speech secara detail dengan memilih 8 suara berkualitas tinggi, beragam bahasa, dan aksen.
- Output gambar native: Dapat membuat gambar dan mendukung pengeditan percakapan multi-turn sehingga gambar dapat disempurnakan berdasarkan output sebelumnya. Berguna untuk membuat konten multimodal seperti resep dengan mencampurkan teks dan gambar.
-
Penggunaan tool secara native:
- Memiliki kemampuan penggunaan tool sebagai fungsi dasar untuk membangun pengalaman agent.
- Dapat memanggil tool seperti Google Search dan eksekusi kode secara native, serta memanfaatkan fungsi pihak ketiga melalui custom function calling.
- Menggunakan Google Search sebagai tool memungkinkan jawaban yang lebih faktual dan komprehensif sekaligus meningkatkan traffic ke publisher.
- Dapat menjalankan beberapa pencarian secara paralel untuk menemukan informasi relevan dari berbagai sumber secara bersamaan dan meningkatkan akurasi.
-
Multimodal Live API:
- Dapat membangun aplikasi multimodal real-time menggunakan input streaming audio dan video dari kamera atau layar.
- Mendukung pola percakapan alami seperti interupsi dan deteksi aktivitas suara.
- Dapat mengintegrasikan beberapa tool untuk menyelesaikan use case yang kompleks dengan satu panggilan API.
Kemajuan dukungan kode AI
- Dukungan kode AI berkembang cepat dari sekadar pencarian kode menjadi asisten berbasis AI yang tertanam dalam workflow developer.
- Coding agent berbasis Gemini 2.0 dapat menjalankan tugas atas nama developer.
- 2.0 Flash yang dilengkapi tool eksekusi kode mencapai tingkat keberhasilan 51.8% di SWE-bench Verified, yang menguji performa agent pada tugas software engineering nyata.
Jules: agent kode berbasis AI
- Agent kode berbasis AI eksperimental yang menangani tugas coding Python dan Javascript.
- Terintegrasi dengan workflow GitHub, bekerja secara asinkron, dan menangani perbaikan bug serta tugas lain yang memakan waktu.
- Jules menyusun rencana multi-langkah yang komprehensif untuk menyelesaikan masalah, memodifikasi banyak file secara efisien, dan menyiapkan pull request untuk langsung menerapkan perubahan di GitHub.
Keunggulan Jules:
- Peningkatan produktivitas: Melalui coding asinkron, masalah dan tugas coding dapat dialokasikan ke Jules untuk meningkatkan efisiensi.
- Pelacakan progres: Tetap mendapatkan informasi melalui update real-time dan dapat memprioritaskan tugas yang memerlukan perhatian.
- Kontrol developer: Dapat meninjau rencana yang dibuat Jules, memberi feedback, atau meminta penyesuaian. Kode yang ditulis Jules juga dapat ditinjau dan di-merge ke proyek.
- Saat ini tersedia untuk kelompok tester tepercaya, dan dijadwalkan tersedia bagi developer lain pada awal 2025.
Agent data science di Colab
- labs.google/code menyediakan agent data science eksperimental yang memungkinkan pengguna mengunggah dataset dan memperoleh insight dalam hitungan menit.
- Kemampuan agent yang sama diintegrasikan ke Colab dengan menggunakan Gemini 2.0.
- Dengan menjelaskan tujuan analisis melalui instruksi bahasa alami, notebook akan dibuat secara otomatis untuk mempercepat riset dan analisis data.
- Akses awal disediakan melalui program tester tepercaya, dan akan dirilis lebih luas kepada pengguna Colab pada paruh pertama 2025.
Dukungan untuk developer
- Model Gemini 2.0 membantu developer membangun aplikasi AI yang kuat dengan lebih cepat dan mudah.
- Gemini 2.0 akan diintegrasikan ke platform seperti Android Studio, Chrome DevTools, dan Firebase.
- Gemini 2.0 Flash juga akan tersedia di Gemini Code Assist untuk kemampuan bantuan coding yang ditingkatkan di IDE populer seperti Visual Studio Code, IntelliJ, dan PyCharm.
1 komentar
Sepertinya sekarang sudah bisa digunakan di Google AI Studio dan Vertex AI.
Performa modelnya dan latensi suara live E2E sangat mengesankan.