- Perusahaan AI dan lembaga riset terkemuka di Eropa mengumumkan proyek OpenEuroLLM untuk bersama-sama mengembangkan model bahasa besar (LLM) open source generasi berikutnya
- Menargetkan performa tinggi dan dukungan multibahasa, serta membangun model yang transparan dan patuh kepatuhan untuk digunakan dalam layanan komersial dan publik
- Sebagai model open source yang transparan dan mematuhi regulasi, proyek ini mematuhi kerangka regulasi Eropa selama proses pengembangan untuk memperluas akses terhadap teknologi AI berkualitas tinggi dan membantu perusahaan Eropa memiliki daya saing di pasar global
- Telah memperoleh sertifikasi STEP (Strategic Technologies for Europe Platform), didanai oleh program Digital Europe Uni Eropa, dan resmi dimulai pada 1 Februari 2025
Poin-poin utama proyek
- Nama proyek: OpenEuroLLM
- Tujuan
- Memperkuat dan meningkatkan daya saing AI serta kedaulatan digital di Eropa melalui LLM open source
- Menunjukkan pentingnya transparansi, keterbukaan, dan partisipasi komunitas dalam ekosistem teknologi Eropa
- Dikembangkan dalam kerangka regulasi Eropa yang kuat untuk menjaga nilai-nilai Eropa dan keunggulan teknis
- Dapat dimanfaatkan secara bebas di sektor komersial dan publik, serta memungkinkan fine-tuning khusus per industri
- Memperkuat lingkungan multilingual dengan mempertimbangkan keragaman bahasa dan budaya di Eropa, serta membantu perusahaan Eropa mengembangkan produk dan layanan berkualitas tinggi di era AI
- Ruang lingkup aktivitas
- Berdasarkan capaian yang sudah ada seperti repositori data berkualitas tinggi dan LLM percontohan, proyek ini bersama-sama mengembangkan model dan perangkat lunak baru
- Bekerja sama dengan komunitas open source dan para ahli industri seperti LAION, open-sci, dan OpenML
- Mengarah pada penyediaan fondasi yang dapat diakses dan ditingkatkan siapa saja melalui pengembangan dan evaluasi model yang transparan
Komposisi mitra
- Universitas dan lembaga riset
- Sebanyak 11 institusi berpartisipasi, termasuk Charles University (Ceko, koordinator), ALT-EDIC (Prancis), Eindhoven University of Technology (Belanda), ELLIS Institute Tübingen (Jerman), dan Fraunhofer IAIS (Jerman)
- Bertanggung jawab atas data skala besar, pengembangan algoritma, dan validasi berdasarkan kapabilitas riset yang kuat
- Perusahaan
- Sebanyak 5 perusahaan berpartisipasi, termasuk AMD Silo AI (Finlandia, co-lead), Aleph Alpha Research (Jerman), ellamind (Jerman), LightOn (Prancis), dan Prompsit Language Engineering (Spanyol)
- Bertanggung jawab atas optimasi model di lapangan industri, pengetahuan komersialisasi, dan studi kasus penerapan bisnis
- Pusat EuroHPC
- Barcelona Supercomputing Center (Spanyol), Cineca Interuniversity Consortium (Italia), CSC - IT Center for Science (Finlandia), SURF (Belanda)
- Bertanggung jawab menyediakan infrastruktur komputasi berkinerja sangat tinggi untuk mendukung pelatihan dan eksperimen
Nilai proyek dan dampak yang diharapkan
- Model open source yang transparan dan patuh regulasi
- Mematuhi regulasi ketat dan sistem nilai Eropa, serta membuka model bahasa berperforma tinggi berskala besar agar dapat dimanfaatkan semua pihak
- Berkontribusi pada daya saing global dan inovasi layanan bagi lembaga publik dan perusahaan
- Dukungan multibahasa dan keragaman budaya
- Mencerminkan beragam bahasa dan karakteristik budaya di Eropa ke dalam model untuk membangun fondasi yang membantu implementasi layanan berkualitas tinggi
- Menciptakan lingkungan agar perusahaan Eropa dapat menyediakan produk yang stabil dan inklusif dengan teknologinya sendiri
- Penguatan ekosistem AI dan kolaborasi
- Lembaga riset, perusahaan, dan pusat superkomputasi Eropa bersama-sama menggabungkan infrastruktur dan keahlian
- Melalui komunitas open source dan kemitraan strategis, proyek ini diharapkan dapat terus ditingkatkan dan diperluas skalanya
1 komentar
Opini Hacker News
Ada pendapat yang skeptis terhadap proyek yang melibatkan banyak institusi. Meskipun ada banyak peserta, ada kekhawatiran bahwa kolaborasi akan sulit karena masing-masing memiliki prioritas yang berbeda. Berdasarkan pengalaman masa lalu, ada pandangan bahwa mereka akan lebih fokus pada riset individual daripada kerja sama
Ada pendapat bahwa meskipun proyek AI Eropa akan sulit bersaing dengan laboratorium riset besar, ini bisa menjadi peluang untuk mengaktifkan AI melalui model open source. Meskipun Eropa akan sulit memperkecil kesenjangan dengan AS dan Tiongkok, proyek ini bisa menjadi katalis untuk meningkatkan daya saing
Ada pendapat bahwa anggaran yang dialokasikan untuk proyek ini tidak memadai. Ditegaskan bahwa pendanaan yang dibutuhkan untuk proyek AI Eropa seharusnya jauh lebih besar
Ada pendapat bahwa proyek ini akan menyediakan model AI yang transparan dan patuh regulasi, tetapi dari sisi performa kemungkinan tidak akan memenuhi harapan
Ada pendapat bahwa alasan laboratorium riset AI dan perusahaan besar di Eropa tidak ikut serta dalam proyek ini adalah karena kemungkinan gagalnya tinggi
Ada pendapat yang menekankan pentingnya proyek ini, dan bahwa membangun infrastruktur AI yang independen di Eropa adalah hal yang esensial. Ada harapan bahwa Open LLM akan menaikkan standar keberhasilan jangka panjang AI
Ada pendapat bahwa proyek ini sudah memiliki data yang baik dan model yang sudah ada, serta hasil komersial juga bisa diharapkan. Perusahaan seperti Red Hat, Volvo, dan SAAB ikut berpartisipasi
Ada pendapat bahwa regulasi perlindungan data pribadi di Eropa pada praktiknya tidak benar-benar membuat perbedaan besar. Ada harapan bahwa Eropa akan segera menyelesaikan masalah ini