LG AI Research merilis EXAONE Deep

lemonmint · 2025-03-19T10:45:38+09:00

Model AI Reasoning baru yang dikembangkan oleh LG AI Research, EXAONE Deep, telah diperkenalkan Model penalaran berperforma tinggi yang esensial untuk transisi menuju era Agentic AI Membuktikan kemampuan penalaran yang unggul di bidang matematika, sains, dan coding Fitur utama: Matematika: Performa unggul dibanding model pesaing pada benchmark matematika tingkat tinggi (mencapai performa setara dengan ukuran model yang lebih kecil) Sains & Coding: Meraih peringkat 1 pada benchmark utama (model 7.8B dan 2.4B) MMLU: Mencapai performa tertinggi di antara model domestik (model 32B) Terdaftar dalam daftar model AI terkemuka dari Epoch AI, sehingga performanya tervalidasi (menjadi model EXAONE kedua setelah EXAONE 3.5) Performa luar biasa di bidang matematika Semua model EXAONE Deep (32B, 7.8B, 2.4B) memperoleh skor tertinggi pada bagian matematika CSAT tahun ajaran 2025 EXAONE Deep 32B: Skor matematika CSAT 94.5 dan AIME 2024 sebesar 90.0 Menunjukkan performa setara dengan model DeepSeek-R1 (671B) pada AIME 2025 Khususnya menunjukkan performa unggul pada AIME, benchmark dengan tingkat kesulitan tinggi, sehingga membuktikan efisiensi pelatihan dan efisiensi biaya EXAONE Deep 7.8B & 2.4B: Masing-masing menempati peringkat 1 pada benchmark utama di kategori model ringan dan model on-device Model 7.8B: MATH-500 94.8, AIME 2025 59.6 Model 2.4B: MATH-500 92.3, AIME 2024 47.9 Benchmark matematika utama: CSAT (College Scholastic Ability Test) AIME (American Invitational Mathematics Examination) MATH-500 Keahlian unggul di bidang sains dan coding Di bidang sains dan coding juga terbukti memiliki performa yang lebih baik dibanding model pesaing EXAONE Deep 32B: Skor 66.1 pada tes GPQA Diamond (menilai kemampuan menyelesaikan masalah sains setingkat PhD) Skor 59.5 pada LiveCodeBench (menilai kemampuan coding), melampaui model AI Reasoning dengan skala serupa Menunjukkan potensi pemanfaatan yang tinggi bahkan di bidang yang membutuhkan pengetahuan spesialis EXAONE Deep 7.8B & 2.4B: Meraih peringkat 1 pada GPQA Diamond dan LiveCodeBench Setelah model EXAONE 3.5 2.4B, model ini semakin menegaskan posisinya sebagai model global terdepan di ranah model ringan/on-device Benchmark utama untuk sains dan coding: GPQA Diamond LiveCodeBench

(lgresearch.ai)

24 poin oleh lemonmint 2025-03-19 | 9 komentar | Bagikan ke WhatsApp

Model AI Reasoning baru yang dikembangkan oleh LG AI Research, EXAONE Deep, telah diperkenalkan
Model penalaran berperforma tinggi yang esensial untuk transisi menuju era Agentic AI
Membuktikan kemampuan penalaran yang unggul di bidang matematika, sains, dan coding
Fitur utama:
- Matematika: Performa unggul dibanding model pesaing pada benchmark matematika tingkat tinggi (mencapai performa setara dengan ukuran model yang lebih kecil)
- Sains & Coding: Meraih peringkat 1 pada benchmark utama (model 7.8B dan 2.4B)
- MMLU: Mencapai performa tertinggi di antara model domestik (model 32B)
Terdaftar dalam daftar model AI terkemuka dari Epoch AI, sehingga performanya tervalidasi (menjadi model EXAONE kedua setelah EXAONE 3.5)

Performa luar biasa di bidang matematika

Semua model EXAONE Deep (32B, 7.8B, 2.4B) memperoleh skor tertinggi pada bagian matematika CSAT tahun ajaran 2025
EXAONE Deep 32B:
- Skor matematika CSAT 94.5 dan AIME 2024 sebesar 90.0
- Menunjukkan performa setara dengan model DeepSeek-R1 (671B) pada AIME 2025
- Khususnya menunjukkan performa unggul pada AIME, benchmark dengan tingkat kesulitan tinggi, sehingga membuktikan efisiensi pelatihan dan efisiensi biaya
EXAONE Deep 7.8B & 2.4B:
- Masing-masing menempati peringkat 1 pada benchmark utama di kategori model ringan dan model on-device
- Model 7.8B: MATH-500 94.8, AIME 2025 59.6
- Model 2.4B: MATH-500 92.3, AIME 2024 47.9
Benchmark matematika utama:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500

Keahlian unggul di bidang sains dan coding

Di bidang sains dan coding juga terbukti memiliki performa yang lebih baik dibanding model pesaing
EXAONE Deep 32B:
- Skor 66.1 pada tes GPQA Diamond (menilai kemampuan menyelesaikan masalah sains setingkat PhD)
- Skor 59.5 pada LiveCodeBench (menilai kemampuan coding), melampaui model AI Reasoning dengan skala serupa
- Menunjukkan potensi pemanfaatan yang tinggi bahkan di bidang yang membutuhkan pengetahuan spesialis
EXAONE Deep 7.8B & 2.4B:
- Meraih peringkat 1 pada GPQA Diamond dan LiveCodeBench
- Setelah model EXAONE 3.5 2.4B, model ini semakin menegaskan posisinya sebagai model global terdepan di ranah model ringan/on-device
Benchmark utama untuk sains dan coding:
- GPQA Diamond
- LiveCodeBench

9 komentar

sice81 2025-03-20

Wow, saya mendukung LG. Bukankah LLM mereka hampir yang terbaik di negara kita? Katanya juga dimanfaatkan dengan baik untuk sistem internal... Tapi lisensinya agak disayangkan. Kalau versi baru keluar, akan bagus kalau versi lamanya dirilis dengan lisensi MIT.

mindok 2025-03-19

EXAONE 3.5 juga sudah cukup bagus untuk dijalankan secara lokal di laptop, jadi ini patut ditunggu.

bungker 2025-03-19

Saya cukup terkejut. Saya kira ini cuma untuk pencitraan, tapi LG yang konservatif itu sampai merilis hal seperti ini dan bahkan membukanya ke publik..

halfenif 2025-03-20

Saya jadi penasaran, dengan lisensi yang saya temukan ini, sebenarnya bisa dimanfaatkan seperti apa.

Restrictions
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.

3.1 Penggunaan komersial: Penerima lisensi secara tegas dilarang menggunakan Model, Turunan, atau Output untuk tujuan komersial apa pun, termasuk namun tidak terbatas pada pengembangan atau penerapan produk, layanan, atau aplikasi yang menghasilkan pendapatan, baik secara langsung maupun tidak langsung.

Ownership
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 Output: Semua hak, kepemilikan, dan kepentingan atas Output yang dihasilkan oleh Model dan Turunan, baik dalam bentuk asli maupun yang telah dimodifikasi, merupakan dan akan tetap menjadi milik eksklusif Pemberi Lisensi.

yosemite 2025-03-20

Ya. Ini adalah lisensi yang tidak mengizinkan penggunaan komersial. Karena itu, bagi saya ini dikeluarkan dari pertimbangan.

junia3 2025-03-19

Saya sudah mencoba menginstalnya di server dan memakainya, tetapi dibandingkan qwq, waktu think-nya jadi terlalu lama.
Entah akurasinya memang bagus atau tidak, tetapi latensinya terasa lebih parah dari yang saya kira.

junia3 2025-03-19

Ternyata itu hanya terjadi pada beberapa masalah saja. Setelah saya mencoba menjalankan beberapa lagi dan membandingkannya, hasilnya tampaknya keluar dengan mirip.

nowdoit7 2025-03-19

Semangat terus~ LG~ fighting~

jujumilk3 2025-03-19

Saya mendukung Anda. Saya menekan suka di mana pun saya melihatnya di LinkedIn.

LG AI Research merilis EXAONE Deep

Performa luar biasa di bidang matematika

Keahlian unggul di bidang sains dan coding

Bacaan terkait

9 komentar