- Gemini 3 Pro adalah model penalaran multimodal generasi berikutnya dari Google, dengan arsitektur berkinerja tinggi yang memproses beragam input seperti teks, gambar, audio, video, dan kode
- Menggunakan arsitektur Transformer berbasis Sparse Mixture-of-Experts (MoE) untuk meningkatkan efisiensi dan performa secara bersamaan
- Data pelatihan terdiri dari dokumen web, kode, gambar, audio, video, data pengguna, dan data sintetis, serta melalui proses pemfilteran keamanan dan penghapusan duplikasi
- Model ini dilatih dengan TPU serta JAX·ML Pathways, dan disediakan melalui berbagai kanal seperti Google Cloud, Vertex AI, Gemini API
- Telah lolos evaluasi keselamatan dan verifikasi Frontier Safety Framework, serta mencapai peningkatan penalaran, keselamatan, dan tone dibanding Gemini 2.5 Pro
Gambaran model
- Gemini 3 Pro adalah generasi terbaru dari seri Gemini, model unggulan Google yang mendukung penalaran tingkat tinggi dan pemahaman multimodal
- Mampu memahami berbagai sumber informasi seperti teks, audio, gambar, video, dan repositori kode
- Mendukung input hingga 1 juta token dan output hingga 64K token
- Mengadopsi struktur Sparse Mixture-of-Experts (MoE), sehingga hanya sebagian parameter expert yang diaktifkan untuk tiap token input, meningkatkan efisiensi komputasi
- Memiliki arsitektur dengan peningkatan baik pada performa maupun efisiensi dibanding generasi sebelumnya
Data pelatihan
- Data prapelatihan mencakup berbagai domain seperti dokumen web publik, kode, gambar, audio, dan video
- Data pascapelatihan terdiri dari pasangan instruksi-jawaban terverifikasi, preferensi manusia, dan data penggunaan alat
- Sumber data
- Dataset publik, data hasil crawling, dan data berlisensi komersial
- Data pengguna layanan Google (dikumpulkan sesuai ketentuan, kebijakan, dan kontrol pengguna)
- Termasuk data yang dihasilkan internal Google dan data sintetis AI
- Proses prapemrosesan
- Melakukan penghapusan duplikasi, kepatuhan terhadap robots.txt, pemfilteran keamanan, dan pemfilteran kualitas
- Menghapus konten berbahaya seperti pornografi, kekerasan, dan materi eksploitasi seksual anak (CSAM)
Implementasi dan keberlanjutan
- Perangkat keras: menggunakan TPU milik Google
- Meningkatkan kecepatan pelatihan melalui pemrosesan komputasi skala besar dan memori berbandwidth tinggi
- Menjamin skalabilitas dan efisiensi melalui pelatihan terdistribusi dengan TPU Pod
- Selaras dengan tujuan keberlanjutan Google
- Perangkat lunak: pelatihan berbasis JAX dan ML Pathways
Kanal distribusi
- Gemini 3 Pro tersedia melalui platform berikut
- Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
- Disediakan dalam bentuk API, tanpa kebutuhan perangkat keras atau perangkat lunak tambahan
- Penggunaan mengikuti ketentuan layanan dan klausul tambahan masing-masing platform
Evaluasi dan performa
- Cakupan evaluasi: penalaran, kemampuan multimodal, penggunaan alat, performa multibahasa, dan pemrosesan konteks panjang
- Hasil: Gemini 3 Pro menunjukkan peningkatan performa secara keseluruhan dibanding Gemini 2.5 Pro
- Terutama ada peningkatan besar pada kemampuan penalaran dan pemrosesan multimodal
- Hasil benchmark terperinci dapat dilihat di deepmind.com/models/evals/gemini-3-pro
Tujuan penggunaan dan keterbatasan
- Area pemanfaatan utama:
- Penyelesaian masalah kompleks, pekerjaan kreatif, perencanaan strategis, dan perbaikan bertahap
- Performa bergaya agen, coding tingkat lanjut, pemahaman konteks panjang, pengembangan algoritma, dan lain-lain
- Keterbatasan:
- Tetap memiliki keterbatasan umum model besar (misalnya halusinasi)
- Dapat terjadi latensi atau timeout sesekali
- Knowledge cutoff: Januari 2025
- Penggunaan yang tidak diizinkan:
- Tindakan ilegal atau berbahaya, pelanggaran keamanan, konten seksual, kekerasan, kebencian, pembuatan misinformasi, dan sebagainya
- Berlaku kebijakan larangan Generative AI milik Google
Etika dan keamanan konten
- Proses pengembangan: bekerja sama dengan tim internal keselamatan, keamanan, dan tanggung jawab untuk melakukan evaluasi serta pengujian red team
- Jenis evaluasi
- Pemantauan berkelanjutan melalui evaluasi otomatis dan manusia
- Human Red Teaming oleh tim ahli eksternal
- Pemeriksaan keselamatan skala besar dengan Automated Red Teaming
- Dilakukan tinjauan etika dan keselamatan sebelum peluncuran
- Kebijakan keselamatan:
- Memblokir konten terkait eksploitasi dan pelecehan seksual anak
- Memblokir ujaran kebencian
- Memblokir konten yang mendorong bunuh diri atau perilaku berbahaya
- Memblokir perundungan dan hasutan kekerasan
- Memblokir konten seksual eksplisit
- Memblokir saran medis yang bertentangan dengan konsensus ilmiah
Hasil evaluasi keselamatan
- Hasil evaluasi otomatis (vs Gemini 2.5 Pro)
- Text-to-Text Safety: -10.4%
- Multilingual Safety: +0.2% (perubahan tidak signifikan)
- Image-to-Text Safety: +3.1% (perubahan tidak signifikan)
- Tone: +7.9%
- Unjustified Refusals: +3.7% (perubahan tidak signifikan)
- Interpretasi: secara keseluruhan terdapat peningkatan tone dan keselamatan, serta penurunan tingkat penolakan yang tidak akurat
- Hasil Human Red Teaming:
- Memenuhi standar keselamatan anak, dengan performa keselamatan setara atau lebih baik dibanding Gemini 2.5 Pro
- Bahkan pada pengujian yang diperluas ke area di luar kebijakan, tidak ditemukan masalah serius
Faktor risiko dan mitigasi
- Risiko utama:
- Kerentanan jailbreak (sudah membaik tetapi belum sepenuhnya terselesaikan)
- Potensi penurunan kualitas pada percakapan multi-turn
- Langkah mitigasi:
- Pemfilteran data, conditional pre-training, supervised fine-tuning, serta reinforcement learning berbasis umpan balik manusia dan kritikus
- Penerapan kebijakan keselamatan dan pemfilteran pada level produk
Evaluasi Frontier Safety
- Diverifikasi berdasarkan Google DeepMind Frontier Safety Framework (September 2025)
- Hasil: tidak mencapai Critical Capability Level (CCL) apa pun
- CBRN: tidak cukup untuk meningkatkan kemampuan aktor ancaman
- Keamanan siber: beberapa tugas terselesaikan (11/12), tugas tingkat tinggi belum terselesaikan (0/13)
- Manipulasi berbahaya: tidak ada kenaikan signifikan dibanding model sebelumnya
- R&D pembelajaran mesin: meningkat dibanding Gemini 2.5, tetapi masih di bawah ambang peringatan
- Risiko salah deteksi, salah penilaian, dan manipulasi: tetap berada pada tingkat rendah
- Kesimpulan: berada di bawah ambang risiko menurut kriteria Frontier Safety, dengan keselamatan terjamin
Ringkasan keseluruhan
- Gemini 3 Pro adalah model multimodal dengan performa tertinggi dari Google, dengan peningkatan pada kemampuan penalaran, keselamatan, dan efisiensi
- Pelatihan berbasis TPU dan struktur MoE mengoptimalkan pemrosesan data skala besar
- Sistem verifikasi etika dan keselamatan diperkuat, serta memenuhi kriteria Frontier Safety Framework
- Meningkat secara keseluruhan dibanding Gemini 2.5 Pro, dan dinilai sebagai model AI yang aman dan skalabel untuk penggunaan nyata
Belum ada komentar.