2 poin oleh GN⁺ 2025-11-19 | Belum ada komentar. | Bagikan ke WhatsApp
  • Gemini 3 Pro adalah model penalaran multimodal generasi berikutnya dari Google, dengan arsitektur berkinerja tinggi yang memproses beragam input seperti teks, gambar, audio, video, dan kode
  • Menggunakan arsitektur Transformer berbasis Sparse Mixture-of-Experts (MoE) untuk meningkatkan efisiensi dan performa secara bersamaan
  • Data pelatihan terdiri dari dokumen web, kode, gambar, audio, video, data pengguna, dan data sintetis, serta melalui proses pemfilteran keamanan dan penghapusan duplikasi
  • Model ini dilatih dengan TPU serta JAX·ML Pathways, dan disediakan melalui berbagai kanal seperti Google Cloud, Vertex AI, Gemini API
  • Telah lolos evaluasi keselamatan dan verifikasi Frontier Safety Framework, serta mencapai peningkatan penalaran, keselamatan, dan tone dibanding Gemini 2.5 Pro

Gambaran model

  • Gemini 3 Pro adalah generasi terbaru dari seri Gemini, model unggulan Google yang mendukung penalaran tingkat tinggi dan pemahaman multimodal
    • Mampu memahami berbagai sumber informasi seperti teks, audio, gambar, video, dan repositori kode
    • Mendukung input hingga 1 juta token dan output hingga 64K token
  • Mengadopsi struktur Sparse Mixture-of-Experts (MoE), sehingga hanya sebagian parameter expert yang diaktifkan untuk tiap token input, meningkatkan efisiensi komputasi
  • Memiliki arsitektur dengan peningkatan baik pada performa maupun efisiensi dibanding generasi sebelumnya

Data pelatihan

  • Data prapelatihan mencakup berbagai domain seperti dokumen web publik, kode, gambar, audio, dan video
  • Data pascapelatihan terdiri dari pasangan instruksi-jawaban terverifikasi, preferensi manusia, dan data penggunaan alat
  • Sumber data
    • Dataset publik, data hasil crawling, dan data berlisensi komersial
    • Data pengguna layanan Google (dikumpulkan sesuai ketentuan, kebijakan, dan kontrol pengguna)
    • Termasuk data yang dihasilkan internal Google dan data sintetis AI
  • Proses prapemrosesan
    • Melakukan penghapusan duplikasi, kepatuhan terhadap robots.txt, pemfilteran keamanan, dan pemfilteran kualitas
    • Menghapus konten berbahaya seperti pornografi, kekerasan, dan materi eksploitasi seksual anak (CSAM)

Implementasi dan keberlanjutan

  • Perangkat keras: menggunakan TPU milik Google
    • Meningkatkan kecepatan pelatihan melalui pemrosesan komputasi skala besar dan memori berbandwidth tinggi
    • Menjamin skalabilitas dan efisiensi melalui pelatihan terdistribusi dengan TPU Pod
    • Selaras dengan tujuan keberlanjutan Google
  • Perangkat lunak: pelatihan berbasis JAX dan ML Pathways

Kanal distribusi

  • Gemini 3 Pro tersedia melalui platform berikut
    • Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
  • Disediakan dalam bentuk API, tanpa kebutuhan perangkat keras atau perangkat lunak tambahan
  • Penggunaan mengikuti ketentuan layanan dan klausul tambahan masing-masing platform

Evaluasi dan performa

  • Cakupan evaluasi: penalaran, kemampuan multimodal, penggunaan alat, performa multibahasa, dan pemrosesan konteks panjang
  • Hasil: Gemini 3 Pro menunjukkan peningkatan performa secara keseluruhan dibanding Gemini 2.5 Pro
    • Terutama ada peningkatan besar pada kemampuan penalaran dan pemrosesan multimodal
  • Hasil benchmark terperinci dapat dilihat di deepmind.com/models/evals/gemini-3-pro

Tujuan penggunaan dan keterbatasan

  • Area pemanfaatan utama:
    • Penyelesaian masalah kompleks, pekerjaan kreatif, perencanaan strategis, dan perbaikan bertahap
    • Performa bergaya agen, coding tingkat lanjut, pemahaman konteks panjang, pengembangan algoritma, dan lain-lain
  • Keterbatasan:
    • Tetap memiliki keterbatasan umum model besar (misalnya halusinasi)
    • Dapat terjadi latensi atau timeout sesekali
    • Knowledge cutoff: Januari 2025
  • Penggunaan yang tidak diizinkan:
    • Tindakan ilegal atau berbahaya, pelanggaran keamanan, konten seksual, kekerasan, kebencian, pembuatan misinformasi, dan sebagainya
    • Berlaku kebijakan larangan Generative AI milik Google

Etika dan keamanan konten

  • Proses pengembangan: bekerja sama dengan tim internal keselamatan, keamanan, dan tanggung jawab untuk melakukan evaluasi serta pengujian red team
  • Jenis evaluasi
    • Pemantauan berkelanjutan melalui evaluasi otomatis dan manusia
    • Human Red Teaming oleh tim ahli eksternal
    • Pemeriksaan keselamatan skala besar dengan Automated Red Teaming
    • Dilakukan tinjauan etika dan keselamatan sebelum peluncuran
  • Kebijakan keselamatan:
    1. Memblokir konten terkait eksploitasi dan pelecehan seksual anak
    2. Memblokir ujaran kebencian
    3. Memblokir konten yang mendorong bunuh diri atau perilaku berbahaya
    4. Memblokir perundungan dan hasutan kekerasan
    5. Memblokir konten seksual eksplisit
    6. Memblokir saran medis yang bertentangan dengan konsensus ilmiah

Hasil evaluasi keselamatan

  • Hasil evaluasi otomatis (vs Gemini 2.5 Pro)
    • Text-to-Text Safety: -10.4%
    • Multilingual Safety: +0.2% (perubahan tidak signifikan)
    • Image-to-Text Safety: +3.1% (perubahan tidak signifikan)
    • Tone: +7.9%
    • Unjustified Refusals: +3.7% (perubahan tidak signifikan)
  • Interpretasi: secara keseluruhan terdapat peningkatan tone dan keselamatan, serta penurunan tingkat penolakan yang tidak akurat
  • Hasil Human Red Teaming:
    • Memenuhi standar keselamatan anak, dengan performa keselamatan setara atau lebih baik dibanding Gemini 2.5 Pro
    • Bahkan pada pengujian yang diperluas ke area di luar kebijakan, tidak ditemukan masalah serius

Faktor risiko dan mitigasi

  • Risiko utama:
    • Kerentanan jailbreak (sudah membaik tetapi belum sepenuhnya terselesaikan)
    • Potensi penurunan kualitas pada percakapan multi-turn
  • Langkah mitigasi:
    • Pemfilteran data, conditional pre-training, supervised fine-tuning, serta reinforcement learning berbasis umpan balik manusia dan kritikus
    • Penerapan kebijakan keselamatan dan pemfilteran pada level produk

Evaluasi Frontier Safety

  • Diverifikasi berdasarkan Google DeepMind Frontier Safety Framework (September 2025)
  • Hasil: tidak mencapai Critical Capability Level (CCL) apa pun
    • CBRN: tidak cukup untuk meningkatkan kemampuan aktor ancaman
    • Keamanan siber: beberapa tugas terselesaikan (11/12), tugas tingkat tinggi belum terselesaikan (0/13)
    • Manipulasi berbahaya: tidak ada kenaikan signifikan dibanding model sebelumnya
    • R&D pembelajaran mesin: meningkat dibanding Gemini 2.5, tetapi masih di bawah ambang peringatan
    • Risiko salah deteksi, salah penilaian, dan manipulasi: tetap berada pada tingkat rendah
  • Kesimpulan: berada di bawah ambang risiko menurut kriteria Frontier Safety, dengan keselamatan terjamin

Ringkasan keseluruhan

  • Gemini 3 Pro adalah model multimodal dengan performa tertinggi dari Google, dengan peningkatan pada kemampuan penalaran, keselamatan, dan efisiensi
  • Pelatihan berbasis TPU dan struktur MoE mengoptimalkan pemrosesan data skala besar
  • Sistem verifikasi etika dan keselamatan diperkuat, serta memenuhi kriteria Frontier Safety Framework
  • Meningkat secara keseluruhan dibanding Gemini 2.5 Pro, dan dinilai sebagai model AI yang aman dan skalabel untuk penggunaan nyata

Belum ada komentar.

Belum ada komentar.