- Menandai satu tahun sejak peluncuran seri Phi yang membuktikan potensi small language model (SLM), Microsoft mengumumkan keluarga model baru yang dioptimalkan untuk penalaran dan dikhususkan untuk pemikiran multilangkah
- Meski jumlah parameternya kecil, model-model ini menunjukkan performa yang sebanding dengan model besar
- Phi-4-reasoning: 14B parameter, menjalani SFT (Supervised Fine-Tuning) dengan data reasoning berkualitas tinggi
- Phi-4-reasoning-plus: menambahkan RL (Reinforcement Learning) ke model di atas, meningkatkan akurasi dengan penggunaan token 1,5 kali lebih banyak
- Phi-4-mini-reasoning: meski berukuran 3.8B, melampaui model yang lebih dari 2 kali lebih besar pada berbagai benchmark matematika, cocok untuk mobile/edge
- Mengungguli berbagai model seperti OpenThinker-7B, Llama-3.2-3B, dan lini DeepSeek-R1 dari sisi performa
- Hasilnya setara atau lebih baik dari OpenAI o1-mini, terutama kuat pada pengujian berfokus matematika seperti Math-500 dan GPQA Diamond
- Model-model ini juga tersedia sebagai Phi Silica, yaitu versi yang dioptimalkan untuk NPU di Copilot+ PC, sehingga dapat berjalan cepat dan efisien di lingkungan Windows
- Tersedia di Azure AI Foundry dan HuggingFace:
- API pengembang dan alat integrasi lokal juga disediakan sehingga mudah diadopsi ke berbagai lingkungan
Belum ada komentar.