3 poin oleh lemonmint 2024-12-12 | 1 komentar | Bagikan ke WhatsApp

Gemini 2.0: model AI generasi berikutnya untuk developer

  • Model AI mutakhir yang dikembangkan Google untuk membantu developer membangun masa depan AI.
  • Sejak peluncuran Gemini 1.0, jutaan developer telah menggunakan Gemini dalam 109 bahasa melalui Google AI Studio dan Vertex AI.
  • Dengan Gemini 2.0 Flash Experimental, kini dimungkinkan membangun aplikasi yang lebih imersif dan interaktif, serta tersedia coding agent baru yang dapat menjalankan tugas atas nama developer.

Gemini 2.0 Flash

  • Model yang dibangun di atas kesuksesan Gemini 1.5 Flash, menawarkan performa kuat dengan kecepatan 2x lebih cepat dibanding 1.5 Pro.
  • Menyediakan kemampuan output multimodal baru dan penggunaan tool secara native.
  • Memperkenalkan Multimodal Live API untuk membangun aplikasi dinamis melalui streaming audio dan video real-time.
  • Developer dapat menguji dan mengeksplorasi Gemini 2.0 Flash yang masih dalam tahap eksperimental di Google AI Studio dan Vertex AI, dengan rilis umum dijadwalkan pada awal tahun depan.

Fitur utama:

  1. Peningkatan performa:

    • Lebih kuat daripada Gemini 1.5 Pro sambil tetap mempertahankan kecepatan dan efisiensi model Flash.
    • Peningkatan performa pada multimodal, teks, kode, video, pemahaman spasial, dan penalaran.
    • Secara khusus, peningkatan kemampuan pemahaman spasial meningkatkan akurasi pembuatan bounding box untuk objek kecil dalam gambar yang kompleks.
  2. Mode output baru:

    • Dapat menghasilkan respons terpadu yang mencakup teks, audio, dan gambar melalui satu panggilan API.
    • Menerapkan watermark tak terlihat SynthID pada semua output gambar dan audio untuk mengurangi masalah misinformasi dan salah atribusi.
    • Output audio native multibahasa: Dapat mengontrol output audio text-to-speech secara detail dengan memilih 8 suara berkualitas tinggi, beragam bahasa, dan aksen.
    • Output gambar native: Dapat membuat gambar dan mendukung pengeditan percakapan multi-turn sehingga gambar dapat disempurnakan berdasarkan output sebelumnya. Berguna untuk membuat konten multimodal seperti resep dengan mencampurkan teks dan gambar.
  3. Penggunaan tool secara native:

    • Memiliki kemampuan penggunaan tool sebagai fungsi dasar untuk membangun pengalaman agent.
    • Dapat memanggil tool seperti Google Search dan eksekusi kode secara native, serta memanfaatkan fungsi pihak ketiga melalui custom function calling.
    • Menggunakan Google Search sebagai tool memungkinkan jawaban yang lebih faktual dan komprehensif sekaligus meningkatkan traffic ke publisher.
    • Dapat menjalankan beberapa pencarian secara paralel untuk menemukan informasi relevan dari berbagai sumber secara bersamaan dan meningkatkan akurasi.
  4. Multimodal Live API:

    • Dapat membangun aplikasi multimodal real-time menggunakan input streaming audio dan video dari kamera atau layar.
    • Mendukung pola percakapan alami seperti interupsi dan deteksi aktivitas suara.
    • Dapat mengintegrasikan beberapa tool untuk menyelesaikan use case yang kompleks dengan satu panggilan API.

Kemajuan dukungan kode AI

  • Dukungan kode AI berkembang cepat dari sekadar pencarian kode menjadi asisten berbasis AI yang tertanam dalam workflow developer.
  • Coding agent berbasis Gemini 2.0 dapat menjalankan tugas atas nama developer.
  • 2.0 Flash yang dilengkapi tool eksekusi kode mencapai tingkat keberhasilan 51.8% di SWE-bench Verified, yang menguji performa agent pada tugas software engineering nyata.

Jules: agent kode berbasis AI

  • Agent kode berbasis AI eksperimental yang menangani tugas coding Python dan Javascript.
  • Terintegrasi dengan workflow GitHub, bekerja secara asinkron, dan menangani perbaikan bug serta tugas lain yang memakan waktu.
  • Jules menyusun rencana multi-langkah yang komprehensif untuk menyelesaikan masalah, memodifikasi banyak file secara efisien, dan menyiapkan pull request untuk langsung menerapkan perubahan di GitHub.

Keunggulan Jules:

  • Peningkatan produktivitas: Melalui coding asinkron, masalah dan tugas coding dapat dialokasikan ke Jules untuk meningkatkan efisiensi.
  • Pelacakan progres: Tetap mendapatkan informasi melalui update real-time dan dapat memprioritaskan tugas yang memerlukan perhatian.
  • Kontrol developer: Dapat meninjau rencana yang dibuat Jules, memberi feedback, atau meminta penyesuaian. Kode yang ditulis Jules juga dapat ditinjau dan di-merge ke proyek.
  • Saat ini tersedia untuk kelompok tester tepercaya, dan dijadwalkan tersedia bagi developer lain pada awal 2025.

Agent data science di Colab

  • labs.google/code menyediakan agent data science eksperimental yang memungkinkan pengguna mengunggah dataset dan memperoleh insight dalam hitungan menit.
  • Kemampuan agent yang sama diintegrasikan ke Colab dengan menggunakan Gemini 2.0.
  • Dengan menjelaskan tujuan analisis melalui instruksi bahasa alami, notebook akan dibuat secara otomatis untuk mempercepat riset dan analisis data.
  • Akses awal disediakan melalui program tester tepercaya, dan akan dirilis lebih luas kepada pengguna Colab pada paruh pertama 2025.

Dukungan untuk developer

  • Model Gemini 2.0 membantu developer membangun aplikasi AI yang kuat dengan lebih cepat dan mudah.
  • Gemini 2.0 akan diintegrasikan ke platform seperti Android Studio, Chrome DevTools, dan Firebase.
  • Gemini 2.0 Flash juga akan tersedia di Gemini Code Assist untuk kemampuan bantuan coding yang ditingkatkan di IDE populer seperti Visual Studio Code, IntelliJ, dan PyCharm.

1 komentar

 
lemonmint 2024-12-12

Sepertinya sekarang sudah bisa digunakan di Google AI Studio dan Vertex AI.

Performa modelnya dan latensi suara live E2E sangat mengesankan.