Microsoft mengumumkan Phi-4 yang dioptimalkan untuk penalaran

xguru · 2025-05-02T11:36:01+09:00

Menandai satu tahun sejak peluncuran seri Phi yang membuktikan potensi small language model (SLM), Microsoft mengumumkan keluarga model baru yang dioptimalkan untuk penalaran dan dikhususkan untuk pemikiran multilangkah Meski jumlah parameternya kecil, model-model ini menunjukkan performa yang sebanding dengan model besar Phi-4-reasoning: 14B parameter, menjalani SFT (Supervised Fine-Tuning) dengan data reasoning berkualitas tinggi Phi-4-reasoning-plus: menambahkan RL (Reinforcement Learning) ke model di atas, meningkatkan akurasi dengan penggunaan token 1,5 kali lebih banyak Phi-4-mini-reasoning: meski berukuran 3.8B, melampaui model yang lebih dari 2 kali lebih besar pada berbagai benchmark matematika, cocok untuk mobile/edge Mengungguli berbagai model seperti OpenThinker-7B, Llama-3.2-3B, dan lini DeepSeek-R1 dari sisi performa Hasilnya setara atau lebih baik dari OpenAI o1-mini, terutama kuat pada pengujian berfokus matematika seperti Math-500 dan GPQA Diamond Model-model ini juga tersedia sebagai Phi Silica, yaitu versi yang dioptimalkan untuk NPU di Copilot+ PC, sehingga dapat berjalan cepat dan efisien di lingkungan Windows Tersedia di Azure AI Foundry dan HuggingFace: Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning API pengembang dan alat integrasi lokal juga disediakan sehingga mudah diadopsi ke berbagai lingkungan

(azure.microsoft.com)

3 poin oleh xguru 2025-05-02 | Belum ada komentar. | Bagikan ke WhatsApp

Menandai satu tahun sejak peluncuran seri Phi yang membuktikan potensi small language model (SLM), Microsoft mengumumkan keluarga model baru yang dioptimalkan untuk penalaran dan dikhususkan untuk pemikiran multilangkah
Meski jumlah parameternya kecil, model-model ini menunjukkan performa yang sebanding dengan model besar
Phi-4-reasoning: 14B parameter, menjalani SFT (Supervised Fine-Tuning) dengan data reasoning berkualitas tinggi
Phi-4-reasoning-plus: menambahkan RL (Reinforcement Learning) ke model di atas, meningkatkan akurasi dengan penggunaan token 1,5 kali lebih banyak
Phi-4-mini-reasoning: meski berukuran 3.8B, melampaui model yang lebih dari 2 kali lebih besar pada berbagai benchmark matematika, cocok untuk mobile/edge
- Mengungguli berbagai model seperti OpenThinker-7B, Llama-3.2-3B, dan lini DeepSeek-R1 dari sisi performa
- Hasilnya setara atau lebih baik dari OpenAI o1-mini, terutama kuat pada pengujian berfokus matematika seperti Math-500 dan GPQA Diamond
Model-model ini juga tersedia sebagai Phi Silica, yaitu versi yang dioptimalkan untuk NPU di Copilot+ PC, sehingga dapat berjalan cepat dan efisien di lingkungan Windows
Tersedia di Azure AI Foundry dan HuggingFace:
API pengembang dan alat integrasi lokal juga disediakan sehingga mudah diadopsi ke berbagai lingkungan

Microsoft mengumumkan Phi-4 yang dioptimalkan untuk penalaran

Bacaan terkait

Belum ada komentar.