31 poin oleh haebom 2025-08-06 | Belum ada komentar. | Bagikan ke WhatsApp

OpenAI secara mengejutkan merilis seri model GPT-OSS (gpt-oss-120b / gpt-oss-20b) dengan lisensi Apache 2.0. Ini adalah model berbobot terbuka pertama yang diperkenalkan sejak GPT-2 enam tahun lalu, dan berpotensi mengubah peta pasar baik dari sisi performa maupun efisiensi.

🧠 Fitur utama

  • Model 20B: arsitektur Mixture of Experts (MoE)
     • 4 dari 128 expert diaktifkan → menjaga performa sambil menurunkan biaya inferensi
     • Mendukung FlashAttention, 128k token, dan menyertakan YaRN
  • Model 20B: dapat dijalankan bahkan di lingkungan GPU 16GB (termasuk Apple Silicon)

📊 Performa benchmark utama (berdasarkan GPT-OSS-120B)

  • MMLU: 90.0% (mirip dengan o4-mini)
  • AIME matematika: 97.9% (kelas teratas untuk matematika + tool)
  • Codeforces Elo: 2622 (kemampuan coding juga berada di papan atas)
  • HealthBench: performa lebih baik dibanding GPT-4o
  • MMMLU (14 bahasa): 81.3% → sangat kuat juga untuk penalaran multibahasa

💡 Kepraktisan & ekosistem

  • Model 120B dapat dijalankan pada satu GPU H100 80GB
  • Model 20B dapat berjalan real-time bahkan di lingkungan 16GB
  • Langsung kompatibel dengan HuggingFace, vLLM, Ollama, dan lainnya

🔐 Keamanan & tanggung jawab

  • Memperkuat konsistensi penalaran berbasis RL
  • Mengadopsi Deliberative Alignment
  • Tidak menghasilkan output berisiko tinggi bahkan saat disalahgunakan secara sengaja

Sepertinya untuk sementara ejekan “ClosedAI” akan sulit dilontarkan. Saya sempat mencobanya sebentar, dan kemampuan bahasa Koreanya juga sangat bagus.

https://huggingface.co/openai/gpt-oss-120b

Belum ada komentar.

Belum ada komentar.