Kartu model Gemini 3 Pro

(pixeldrain.com)

2 poin oleh GN⁺ 2025-11-19 | 1 komentar | Bagikan ke WhatsApp

Gemini 3 Pro adalah model penalaran multimodal generasi berikutnya dari Google, dengan arsitektur berkinerja tinggi yang memproses beragam input seperti teks, gambar, audio, video, dan kode
Menggunakan arsitektur Transformer berbasis Sparse Mixture-of-Experts (MoE) untuk meningkatkan efisiensi dan performa secara bersamaan
Data pelatihan terdiri dari dokumen web, kode, gambar, audio, video, data pengguna, dan data sintetis, serta melalui proses pemfilteran keamanan dan penghapusan duplikasi
Model ini dilatih dengan TPU serta JAX·ML Pathways, dan disediakan melalui berbagai kanal seperti Google Cloud, Vertex AI, Gemini API
Telah lolos evaluasi keselamatan dan verifikasi Frontier Safety Framework, serta mencapai peningkatan penalaran, keselamatan, dan tone dibanding Gemini 2.5 Pro

Gambaran model

Gemini 3 Pro adalah generasi terbaru dari seri Gemini, model unggulan Google yang mendukung penalaran tingkat tinggi dan pemahaman multimodal
- Mampu memahami berbagai sumber informasi seperti teks, audio, gambar, video, dan repositori kode
- Mendukung input hingga 1 juta token dan output hingga 64K token
Mengadopsi struktur Sparse Mixture-of-Experts (MoE), sehingga hanya sebagian parameter expert yang diaktifkan untuk tiap token input, meningkatkan efisiensi komputasi
Memiliki arsitektur dengan peningkatan baik pada performa maupun efisiensi dibanding generasi sebelumnya

Data pelatihan

Data prapelatihan mencakup berbagai domain seperti dokumen web publik, kode, gambar, audio, dan video
Data pascapelatihan terdiri dari pasangan instruksi-jawaban terverifikasi, preferensi manusia, dan data penggunaan alat
Sumber data
- Dataset publik, data hasil crawling, dan data berlisensi komersial
- Data pengguna layanan Google (dikumpulkan sesuai ketentuan, kebijakan, dan kontrol pengguna)
- Termasuk data yang dihasilkan internal Google dan data sintetis AI
Proses prapemrosesan
- Melakukan penghapusan duplikasi, kepatuhan terhadap robots.txt, pemfilteran keamanan, dan pemfilteran kualitas
- Menghapus konten berbahaya seperti pornografi, kekerasan, dan materi eksploitasi seksual anak (CSAM)

Implementasi dan keberlanjutan

Perangkat keras: menggunakan TPU milik Google
- Meningkatkan kecepatan pelatihan melalui pemrosesan komputasi skala besar dan memori berbandwidth tinggi
- Menjamin skalabilitas dan efisiensi melalui pelatihan terdistribusi dengan TPU Pod
- Selaras dengan tujuan keberlanjutan Google
Perangkat lunak: pelatihan berbasis JAX dan ML Pathways

Kanal distribusi

Gemini 3 Pro tersedia melalui platform berikut
- Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
Disediakan dalam bentuk API, tanpa kebutuhan perangkat keras atau perangkat lunak tambahan
Penggunaan mengikuti ketentuan layanan dan klausul tambahan masing-masing platform

Evaluasi dan performa

Cakupan evaluasi: penalaran, kemampuan multimodal, penggunaan alat, performa multibahasa, dan pemrosesan konteks panjang
Hasil: Gemini 3 Pro menunjukkan peningkatan performa secara keseluruhan dibanding Gemini 2.5 Pro
- Terutama ada peningkatan besar pada kemampuan penalaran dan pemrosesan multimodal
Hasil benchmark terperinci dapat dilihat di deepmind.com/models/evals/gemini-3-pro

Tujuan penggunaan dan keterbatasan

Area pemanfaatan utama:
- Penyelesaian masalah kompleks, pekerjaan kreatif, perencanaan strategis, dan perbaikan bertahap
- Performa bergaya agen, coding tingkat lanjut, pemahaman konteks panjang, pengembangan algoritma, dan lain-lain
Keterbatasan:
- Tetap memiliki keterbatasan umum model besar (misalnya halusinasi)
- Dapat terjadi latensi atau timeout sesekali
- Knowledge cutoff: Januari 2025
Penggunaan yang tidak diizinkan:
- Tindakan ilegal atau berbahaya, pelanggaran keamanan, konten seksual, kekerasan, kebencian, pembuatan misinformasi, dan sebagainya
- Berlaku kebijakan larangan Generative AI milik Google

Etika dan keamanan konten

Proses pengembangan: bekerja sama dengan tim internal keselamatan, keamanan, dan tanggung jawab untuk melakukan evaluasi serta pengujian red team
Jenis evaluasi
- Pemantauan berkelanjutan melalui evaluasi otomatis dan manusia
- Human Red Teaming oleh tim ahli eksternal
- Pemeriksaan keselamatan skala besar dengan Automated Red Teaming
- Dilakukan tinjauan etika dan keselamatan sebelum peluncuran
Kebijakan keselamatan:
1. Memblokir konten terkait eksploitasi dan pelecehan seksual anak
2. Memblokir ujaran kebencian
3. Memblokir konten yang mendorong bunuh diri atau perilaku berbahaya
4. Memblokir perundungan dan hasutan kekerasan
5. Memblokir konten seksual eksplisit
6. Memblokir saran medis yang bertentangan dengan konsensus ilmiah

Hasil evaluasi keselamatan

Hasil evaluasi otomatis (vs Gemini 2.5 Pro)
- Text-to-Text Safety: -10.4%
- Multilingual Safety: +0.2% (perubahan tidak signifikan)
- Image-to-Text Safety: +3.1% (perubahan tidak signifikan)
- Tone: +7.9%
- Unjustified Refusals: +3.7% (perubahan tidak signifikan)
Interpretasi: secara keseluruhan terdapat peningkatan tone dan keselamatan, serta penurunan tingkat penolakan yang tidak akurat
Hasil Human Red Teaming:
- Memenuhi standar keselamatan anak, dengan performa keselamatan setara atau lebih baik dibanding Gemini 2.5 Pro
- Bahkan pada pengujian yang diperluas ke area di luar kebijakan, tidak ditemukan masalah serius

Faktor risiko dan mitigasi

Risiko utama:
- Kerentanan jailbreak (sudah membaik tetapi belum sepenuhnya terselesaikan)
- Potensi penurunan kualitas pada percakapan multi-turn
Langkah mitigasi:
- Pemfilteran data, conditional pre-training, supervised fine-tuning, serta reinforcement learning berbasis umpan balik manusia dan kritikus
- Penerapan kebijakan keselamatan dan pemfilteran pada level produk

Evaluasi Frontier Safety

Diverifikasi berdasarkan Google DeepMind Frontier Safety Framework (September 2025)
Hasil: tidak mencapai Critical Capability Level (CCL) apa pun
- CBRN: tidak cukup untuk meningkatkan kemampuan aktor ancaman
- Keamanan siber: beberapa tugas terselesaikan (11/12), tugas tingkat tinggi belum terselesaikan (0/13)
- Manipulasi berbahaya: tidak ada kenaikan signifikan dibanding model sebelumnya
- R&D pembelajaran mesin: meningkat dibanding Gemini 2.5, tetapi masih di bawah ambang peringatan
- Risiko salah deteksi, salah penilaian, dan manipulasi: tetap berada pada tingkat rendah
Kesimpulan: berada di bawah ambang risiko menurut kriteria Frontier Safety, dengan keselamatan terjamin

Ringkasan keseluruhan

Gemini 3 Pro adalah model multimodal dengan performa tertinggi dari Google, dengan peningkatan pada kemampuan penalaran, keselamatan, dan efisiensi
Pelatihan berbasis TPU dan struktur MoE mengoptimalkan pemrosesan data skala besar
Sistem verifikasi etika dan keselamatan diperkuat, serta memenuhi kriteria Frontier Safety Framework
Meningkat secara keseluruhan dibanding Gemini 2.5 Pro, dan dinilai sebagai model AI yang aman dan skalabel untuk penggunaan nyata

1 komentar

GN⁺ 2025-11-19

Komentar Hacker News

Komentar aslinya dipindahkan ke thread ini
Diakhiri dengan ucapan terima kasih karena sudah merapikannya

Kartu model Gemini 3 Pro

Gambaran model

Data pelatihan

Implementasi dan keberlanjutan

Kanal distribusi

Evaluasi dan performa

Tujuan penggunaan dan keterbatasan

Etika dan keamanan konten

Hasil evaluasi keselamatan

Faktor risiko dan mitigasi

Evaluasi Frontier Safety

Ringkasan keseluruhan

Bacaan terkait

1 komentar

Komentar Hacker News