7 poin oleh GN⁺ 2025-07-14 | 2 komentar | Bagikan ke WhatsApp
  • Solar Pro 2 adalah model bahasa frontier baru dari Upstage yang menghadirkan kemampuan penalaran generasi berikutnya, fleksibilitas penggunaan berbagai alat, serta performa pemrosesan bahasa Korea dan multibahasa terbaik di kelasnya, meski berukuran ringkas dengan 31B parameter
  • Pada benchmark utama bahasa Korea (misalnya Ko-Arena-Hard-Auto, Ko-MMLU, dll.), model ini menunjukkan hasil yang setara atau melampaui GPT-4 dan Claude 3, serta menghasilkan jawaban yang konsisten dan akurat di domain profesional seperti hukum, keuangan, dan medis
  • Dalam mode penalaran yang ditingkatkan, model ini dapat menangani berbagai tugas seperti soal matematika, tanya jawab logika, dan penalaran multistep yang kompleks, serta membuktikan performa unggul dalam evaluasi kode dan rekayasa
  • Model ini dilengkapi arsitektur berbasis agen untuk penerapan di pekerjaan nyata, serta fitur integrasi alat, pembuatan file, dan eksekusi otonom, sehingga dapat langsung diadopsi di lingkungan perusahaan
  • LLM generasi berikutnya yang menekankan kegunaan bisnis nyata seperti deployment cloud dan on-premise, peningkatan stabilitas dan kemudahan penggunaan, serta dukungan adopsi enterprise

Kinerja tingkat frontier global terbukti, Solar Pro 2 resmi dirilis

  • Solar Pro 2 adalah model bahasa frontier generasi berikutnya yang dikembangkan Upstage. Meski berukuran ringkas dengan 31B parameter, model ini menawarkan pemrosesan multibahasa yang luas, kemampuan penalaran tingkat lanjut, dan pemanfaatan alat yang dioptimalkan untuk pekerjaan nyata
  • Secara khusus dalam pemrosesan bahasa Korea, model ini membuktikan performa yang cukup kuat untuk bersaing dengan GPT-4 dan Claude 3, serta menunjukkan akurasi dan konsistensi di domain sulit seperti hukum, keuangan, dan medis

Performa pemrosesan bahasa Korea terbaik di kelasnya

  • Pada benchmark seperti Ko-Arena-Hard-Auto, model ini mencapai hasil yang setara dengan model-model papan atas
  • Dalam berbagai tugas NLP bahasa Korea seperti Ko-MMLU, Hae-Rae, dan Ko-IFEval, model ini menunjukkan performa terdepan di seluruh aspek pemahaman dan generasi bahasa
  • Bahkan di domain profesional (hukum, keuangan, medis, dll.), model ini memberikan hasil yang stabil dan akurat

Kemampuan penalaran yang berevolusi

  • Di saat transparansi dan keterjelasan proses penalaran menjadi penting, Solar Pro 2 melampaui prediksi sederhana dengan mewujudkan analisis, sintesis, dan pemikiran bertahap
  • Pada benchmark penalaran umum seperti MMLU, MMLU-Pro, dan HumanEval, performa tugas multistep berbahasa Korea meningkat secara signifikan
  • Model ini juga unggul dalam soal matematika tingkat tinggi seperti Math500 dan AIME, serta dalam penanganan tugas pengembangan yang kompleks seperti SWE-Bench Agentless
  • Model ini memberikan efisiensi penalaran yang sangat baik dibanding jumlah parameternya

LLM berbasis agen yang mendorong pekerjaan nyata

  • Solar Pro 2 adalah LLM berbasis agen yang dilengkapi fitur yang bisa langsung diterapkan dalam pekerjaan nyata seperti integrasi alat, pembuatan file, dan eksekusi tugas otonom
  • Upstage menekankan bahwa ini bukan sekadar model besar, melainkan AI yang realistis dan benar-benar dapat diterjunkan ke pekerjaan
  • Contoh: dapat diterapkan ke berbagai skenario otomatisasi kerja seperti pembuatan otomatis laporan tren kompetitor

2 komentar

 
idunno 2025-07-15

Akan lebih baik kalau peningkatan besar, keunggulan, dan akurasinya ditunjukkan dengan angka.

 
sanxiyn 2025-07-15

Bukankah membandingkannya dengan Claude 3 saat Claude 4 sudah keluar itu hampir seperti menipu...