Upstage merilis model penalaran tingkat frontier Solar Pro 2

(upstage.ai)

7 poin oleh GN⁺ 2025-07-14 | 2 komentar | Bagikan ke WhatsApp

Solar Pro 2 adalah model bahasa frontier baru dari Upstage yang menghadirkan kemampuan penalaran generasi berikutnya, fleksibilitas penggunaan berbagai alat, serta performa pemrosesan bahasa Korea dan multibahasa terbaik di kelasnya, meski berukuran ringkas dengan 31B parameter
Pada benchmark utama bahasa Korea (misalnya Ko-Arena-Hard-Auto, Ko-MMLU, dll.), model ini menunjukkan hasil yang setara atau melampaui GPT-4 dan Claude 3, serta menghasilkan jawaban yang konsisten dan akurat di domain profesional seperti hukum, keuangan, dan medis
Dalam mode penalaran yang ditingkatkan, model ini dapat menangani berbagai tugas seperti soal matematika, tanya jawab logika, dan penalaran multistep yang kompleks, serta membuktikan performa unggul dalam evaluasi kode dan rekayasa
Model ini dilengkapi arsitektur berbasis agen untuk penerapan di pekerjaan nyata, serta fitur integrasi alat, pembuatan file, dan eksekusi otonom, sehingga dapat langsung diadopsi di lingkungan perusahaan
LLM generasi berikutnya yang menekankan kegunaan bisnis nyata seperti deployment cloud dan on-premise, peningkatan stabilitas dan kemudahan penggunaan, serta dukungan adopsi enterprise

Kinerja tingkat frontier global terbukti, Solar Pro 2 resmi dirilis

Solar Pro 2 adalah model bahasa frontier generasi berikutnya yang dikembangkan Upstage. Meski berukuran ringkas dengan 31B parameter, model ini menawarkan pemrosesan multibahasa yang luas, kemampuan penalaran tingkat lanjut, dan pemanfaatan alat yang dioptimalkan untuk pekerjaan nyata
Secara khusus dalam pemrosesan bahasa Korea, model ini membuktikan performa yang cukup kuat untuk bersaing dengan GPT-4 dan Claude 3, serta menunjukkan akurasi dan konsistensi di domain sulit seperti hukum, keuangan, dan medis

Pada benchmark seperti Ko-Arena-Hard-Auto, model ini mencapai hasil yang setara dengan model-model papan atas
Dalam berbagai tugas NLP bahasa Korea seperti Ko-MMLU, Hae-Rae, dan Ko-IFEval, model ini menunjukkan performa terdepan di seluruh aspek pemahaman dan generasi bahasa
Bahkan di domain profesional (hukum, keuangan, medis, dll.), model ini memberikan hasil yang stabil dan akurat

Di saat transparansi dan keterjelasan proses penalaran menjadi penting, Solar Pro 2 melampaui prediksi sederhana dengan mewujudkan analisis, sintesis, dan pemikiran bertahap
Pada benchmark penalaran umum seperti MMLU, MMLU-Pro, dan HumanEval, performa tugas multistep berbahasa Korea meningkat secara signifikan
Model ini juga unggul dalam soal matematika tingkat tinggi seperti Math500 dan AIME, serta dalam penanganan tugas pengembangan yang kompleks seperti SWE-Bench Agentless
Model ini memberikan efisiensi penalaran yang sangat baik dibanding jumlah parameternya

Solar Pro 2 adalah LLM berbasis agen yang dilengkapi fitur yang bisa langsung diterapkan dalam pekerjaan nyata seperti integrasi alat, pembuatan file, dan eksekusi tugas otonom
Upstage menekankan bahwa ini bukan sekadar model besar, melainkan AI yang realistis dan benar-benar dapat diterjunkan ke pekerjaan
Contoh: dapat diterapkan ke berbagai skenario otomatisasi kerja seperti pembuatan otomatis laporan tren kompetitor

idunno 2025-07-15

Akan lebih baik kalau peningkatan besar, keunggulan, dan akurasinya ditunjukkan dengan angka.

sanxiyn 2025-07-15

Bukankah membandingkannya dengan Claude 3 saat Claude 4 sudah keluar itu hampir seperti menipu...