- EuroLLM adalah large language model (LLM) yang mendukung 24 bahasa resmi UE dan dikembangkan bersama oleh lembaga-lembaga riset di Eropa, dengan tujuan kedaulatan AI dan kemandirian teknologi Eropa
- Dengan model 9B parameter, model ini dilatih menggunakan lebih dari 4 triliun token dalam 35 bahasa, sehingga menunjukkan keunggulan pada tugas bahasa seperti tanya jawab, peringkasan, dan terjemahan
- EuroLLM 9B Base dirilis untuk fine-tuning, sementara EuroLLM 9B Instruct adalah versi dengan kemampuan mengikuti instruksi percakapan dan tersedia di Hugging Face
- Proyek ini melibatkan institusi-institusi utama Eropa seperti Unbabel, University of Edinburgh, Técnico Lisboa, Naver Labs Europe, dan dilatih di superkomputer MareNostrum 5
- Proyek ini juga mengumumkan ekspansi multimodal (gambar dan suara) serta kebijakan open source sepenuhnya, dengan target menjadi infrastruktur inti ekosistem inovasi AI di Eropa
Ikhtisar EuroLLM
- EuroLLM adalah large language model (Local LLM) yang dikembangkan di Eropa dan mendukung seluruh 24 bahasa resmi UE
- Dirancang sebagai model AI berbentuk infrastruktur publik yang dapat digunakan warga, perusahaan, dan peneliti Eropa tanpa hambatan bahasa
- Dikembangkan dengan dukungan dari Horizon Europe, European Research Council, dan EuroHPC milik Uni Eropa
- Pelatihan dilakukan di superkomputer MareNostrum 5
Karakteristik teknis
- EuroLLM 9B: berukuran 9 miliar parameter, dilatih dengan 4 triliun token data dalam 35 bahasa
- Model Base ditujukan untuk fine-tuning oleh pengguna, sedangkan model Instruct memiliki kemampuan mengikuti instruksi percakapan
- Fitur utama:
- Dioptimalkan untuk performa pemrosesan bahasa alami multibahasa seperti tanya jawab, peringkasan, dan terjemahan
- Ekspansi multimodal direncanakan — ke depan akan ditambahkan kemampuan memahami gambar dan suara
- Dapat dimanfaatkan secara bebas oleh peneliti, institusi, dan masyarakat umum melalui distribusi open source
Institusi peserta dan jaringan kolaborasi
- Institusi peserta:
- Unbabel, Instituto Superior Técnico, University of Edinburgh, Université Paris-Saclay, Aveni.ai, Sorbonne University, Naver Labs Europe, University of Amsterdam
- Tokoh peneliti utama:
- André Martins (Unbabel, profesor teknik di Lisbon) — pakar machine learning dan pemrosesan bahasa alami
- Alexandra Birch (Aveni.ai, profesor di Edinburgh) — memimpin riset terjemahan multibahasa dan AI etis
- Pierre Colombo (Université Paris-Saclay) — meneliti keamanan AI dan penerapan AI di bidang hukum
Misi dan visi
- Tujuan EuroLLM adalah mengamankan kedaulatan AI Eropa dan mendorong kemajuan teknologi multibahasa
- Melalui LLM yang dikembangkan secara mandiri di Eropa, proyek ini ingin menciptakan siklus inovasi yang mempercepat pertumbuhan (flywheel for innovation)
- Mendukung peneliti dan perusahaan agar dapat mengembangkan layanan dan riset baru berbasis model AI buatan Eropa
- Eropa ingin memperkuat kepemimpinan teknologi berbasis keberagaman bahasa,
serta membangun model inovasi yang mandiri dalam ekosistem AI global
Belum ada komentar.