OpenAI secara mengejutkan merilis seri model GPT-OSS (gpt-oss-120b / gpt-oss-20b) dengan lisensi Apache 2.0. Ini adalah model berbobot terbuka pertama yang diperkenalkan sejak GPT-2 enam tahun lalu, dan berpotensi mengubah peta pasar baik dari sisi performa maupun efisiensi.
🧠 Fitur utama
- Model 20B: arsitektur Mixture of Experts (MoE)
• 4 dari 128 expert diaktifkan → menjaga performa sambil menurunkan biaya inferensi
• Mendukung FlashAttention, 128k token, dan menyertakan YaRN - Model 20B: dapat dijalankan bahkan di lingkungan GPU 16GB (termasuk Apple Silicon)
📊 Performa benchmark utama (berdasarkan GPT-OSS-120B)
- MMLU: 90.0% (mirip dengan o4-mini)
- AIME matematika: 97.9% (kelas teratas untuk matematika + tool)
- Codeforces Elo: 2622 (kemampuan coding juga berada di papan atas)
- HealthBench: performa lebih baik dibanding GPT-4o
- MMMLU (14 bahasa): 81.3% → sangat kuat juga untuk penalaran multibahasa
💡 Kepraktisan & ekosistem
- Model 120B dapat dijalankan pada satu GPU H100 80GB
- Model 20B dapat berjalan real-time bahkan di lingkungan 16GB
- Langsung kompatibel dengan HuggingFace, vLLM, Ollama, dan lainnya
🔐 Keamanan & tanggung jawab
- Memperkuat konsistensi penalaran berbasis RL
- Mengadopsi Deliberative Alignment
- Tidak menghasilkan output berisiko tinggi bahkan saat disalahgunakan secara sengaja
Sepertinya untuk sementara ejekan “ClosedAI” akan sulit dilontarkan. Saya sempat mencobanya sebentar, dan kemampuan bahasa Koreanya juga sangat bagus.
Belum ada komentar.