- Versi terbesar dari Llama 3 dijadwalkan rilis musim panas ini, sementara dua model yang lebih kecil akan dirilis minggu depan
- Peluncuran model kecil diperkirakan akan memicu antusiasme terhadap Llama 3
- Llama 3 diharapkan memiliki kemampuan tanya jawab berbasis gambar seperti GPT-4 milik OpenAI
- Versi terbesarnya akan menjadi model multimodal yang dapat memahami dan menghasilkan teks maupun gambar
- Sebaliknya, dua model kecil yang akan dirilis minggu depan tidak akan bersifat multimodal
Kelebihan dan kekurangan berdasarkan ukuran model
- Model kecil umumnya lebih murah dijalankan dan lebih cepat dibanding model besar
- Hal ini semakin dianggap berharga mengingat biaya menjalankan model besar
- Model kecil juga berguna bagi pengembang yang ingin mengembangkan perangkat lunak AI di perangkat mobile
Perkembangan model Llama milik Meta
- Meta sebelumnya telah merilis tiga model Llama 2
- Model terbesar memiliki 70 miliar parameter
- Dua model lainnya masing-masing memiliki 13 miliar dan 7 miliar parameter
- Versi terbesar dari Llama 3 diperkirakan akan memiliki lebih dari 140 miliar parameter
- Meta menggunakan Llama 2 untuk menyediakan fitur asisten AI di aplikasi-aplikasinya
- Dalam beberapa bulan terakhir, karyawan di divisi AI generatif Meta telah berupaya membuat Llama 3 lebih terbuka, karena mereka menilai Llama 2 merespons pertanyaan kontroversial secara terlalu konservatif
Opini GN⁺
- Peluncuran versi kecil Llama 3 oleh Meta Platforms menunjukkan bahwa persaingan di bidang model bahasa AI semakin ketat. Di tengah kondisi ketika pemain besar seperti Google dan xAI milik Elon Musk sudah merilis model open source, langkah Meta kali ini dapat ditafsirkan sebagai strategi untuk mengamankan pangsa pasar dan mempertahankan kepemimpinan teknologi.
- Peluncuran model versi kecil dapat menjadi strategi pemasaran yang memberi pengembang dan peneliti alat baru, sekaligus meningkatkan minat dan ekspektasi terhadap versi model yang lebih besar. Ini memberi pengguna kesempatan untuk bereksperimen dan terbiasa dengan model kecil sebelum benar-benar menggunakan model besar.
- Peluncuran model bahasa besar secara teknis sangat kompleks, dan untuk melatih serta memelihara model-model ini secara efektif dibutuhkan sumber daya komputasi dan keahlian yang besar. Meta memang memiliki sumber daya tersebut, tetapi penggunaan model secara etis dan persoalan bias tetap menjadi pertimbangan penting.
- Masih belum jelas bagaimana model Llama 3 milik Meta akan dibedakan dari model open source lainnya, serta fitur atau inovasi baru apa yang akan ditawarkannya. Ini dapat menjadi topik diskusi yang menarik di komunitas teknologi.
- Peluncuran model open source mendorong demokratisasi teknologi dan memungkinkan lebih banyak inovasi. Namun, seiring pengaruh model-model ini yang semakin besar, kekhawatiran tentang penyebaran misinformasi, pelanggaran hak cipta, dan masalah privasi juga ikut meningkat.
Belum ada komentar.