- Model AI Reasoning baru yang dikembangkan oleh LG AI Research, EXAONE Deep, telah diperkenalkan
- Model penalaran berperforma tinggi yang esensial untuk transisi menuju era Agentic AI
- Membuktikan kemampuan penalaran yang unggul di bidang matematika, sains, dan coding
- Fitur utama:
- Matematika: Performa unggul dibanding model pesaing pada benchmark matematika tingkat tinggi (mencapai performa setara dengan ukuran model yang lebih kecil)
- Sains & Coding: Meraih peringkat 1 pada benchmark utama (model 7.8B dan 2.4B)
- MMLU: Mencapai performa tertinggi di antara model domestik (model 32B)
- Terdaftar dalam daftar model AI terkemuka dari Epoch AI, sehingga performanya tervalidasi (menjadi model EXAONE kedua setelah EXAONE 3.5)
Performa luar biasa di bidang matematika
- Semua model EXAONE Deep (32B, 7.8B, 2.4B) memperoleh skor tertinggi pada bagian matematika CSAT tahun ajaran 2025
- EXAONE Deep 32B:
- Skor matematika CSAT 94.5 dan AIME 2024 sebesar 90.0
- Menunjukkan performa setara dengan model DeepSeek-R1 (671B) pada AIME 2025
- Khususnya menunjukkan performa unggul pada AIME, benchmark dengan tingkat kesulitan tinggi, sehingga membuktikan efisiensi pelatihan dan efisiensi biaya
- EXAONE Deep 7.8B & 2.4B:
- Masing-masing menempati peringkat 1 pada benchmark utama di kategori model ringan dan model on-device
- Model 7.8B: MATH-500 94.8, AIME 2025 59.6
- Model 2.4B: MATH-500 92.3, AIME 2024 47.9
- Benchmark matematika utama:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500
Keahlian unggul di bidang sains dan coding
- Di bidang sains dan coding juga terbukti memiliki performa yang lebih baik dibanding model pesaing
- EXAONE Deep 32B:
- Skor 66.1 pada tes GPQA Diamond (menilai kemampuan menyelesaikan masalah sains setingkat PhD)
- Skor 59.5 pada LiveCodeBench (menilai kemampuan coding), melampaui model AI Reasoning dengan skala serupa
- Menunjukkan potensi pemanfaatan yang tinggi bahkan di bidang yang membutuhkan pengetahuan spesialis
- EXAONE Deep 7.8B & 2.4B:
- Meraih peringkat 1 pada GPQA Diamond dan LiveCodeBench
- Setelah model EXAONE 3.5 2.4B, model ini semakin menegaskan posisinya sebagai model global terdepan di ranah model ringan/on-device
- Benchmark utama untuk sains dan coding:
- GPQA Diamond
- LiveCodeBench
9 komentar
Wow, saya mendukung LG. Bukankah LLM mereka hampir yang terbaik di negara kita? Katanya juga dimanfaatkan dengan baik untuk sistem internal... Tapi lisensinya agak disayangkan. Kalau versi baru keluar, akan bagus kalau versi lamanya dirilis dengan lisensi MIT.
EXAONE 3.5 juga sudah cukup bagus untuk dijalankan secara lokal di laptop, jadi ini patut ditunggu.
Saya cukup terkejut. Saya kira ini cuma untuk pencitraan, tapi LG yang konservatif itu sampai merilis hal seperti ini dan bahkan membukanya ke publik..
Saya jadi penasaran, dengan lisensi yang saya temukan ini, sebenarnya bisa dimanfaatkan seperti apa.
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.
3.1 Penggunaan komersial: Penerima lisensi secara tegas dilarang menggunakan Model, Turunan, atau Output untuk tujuan komersial apa pun, termasuk namun tidak terbatas pada pengembangan atau penerapan produk, layanan, atau aplikasi yang menghasilkan pendapatan, baik secara langsung maupun tidak langsung.
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.
4.2 Output: Semua hak, kepemilikan, dan kepentingan atas Output yang dihasilkan oleh Model dan Turunan, baik dalam bentuk asli maupun yang telah dimodifikasi, merupakan dan akan tetap menjadi milik eksklusif Pemberi Lisensi.
Ya. Ini adalah lisensi yang tidak mengizinkan penggunaan komersial. Karena itu, bagi saya ini dikeluarkan dari pertimbangan.
Saya sudah mencoba menginstalnya di server dan memakainya, tetapi dibandingkan
qwq, waktu think-nya jadi terlalu lama.Entah akurasinya memang bagus atau tidak, tetapi latensinya terasa lebih parah dari yang saya kira.
Ternyata itu hanya terjadi pada beberapa masalah saja. Setelah saya mencoba menjalankan beberapa lagi dan membandingkannya, hasilnya tampaknya keluar dengan mirip.
Semangat terus~ LG~ fighting~
Saya mendukung Anda. Saya menekan suka di mana pun saya melihatnya di LinkedIn.