- AI21 Labs meluncurkan Jamba, model AI tingkat produksi pertama di dunia yang berbasis arsitektur Mamba
- Jamba menggabungkan kekuatan Mamba SSM (Structured State Space Model) dan arsitektur transformer tradisional untuk menghadirkan peningkatan performa dan efisiensi yang mengesankan
- Memiliki context window luas hingga 256K token. Dapat memproses hingga 140K token pada satu GPU 80GB
Arsitektur hibrida dan performa Jamba
- Jamba memanfaatkan layer Mixture of Experts (MoE) melalui arsitektur hibrida SSM-transformer, dengan hanya 12B dari total 52B parameter yang digunakan saat inferensi
- Dapat menangani konteks yang jauh lebih panjang dibanding model pesaing seperti Llama 2 dari Meta, sambil mempertahankan throughput dan efisiensi yang tinggi
- Memberikan throughput 3x lebih tinggi pada konteks panjang, sehingga lebih efisien dibanding model berbasis transformer dengan ukuran serupa
- Mengusung pendekatan blok dan layer, di mana setiap blok Jamba berisi layer attention atau Mamba yang kemudian diikuti multilayer perceptron (MLP)
- Dalam struktur ini, satu layer transformer digunakan untuk setiap total delapan layer
- Menunjukkan hasil yang unggul di berbagai benchmark, serta melampaui atau menyamai performa model-model mutakhir dengan ukuran serupa pada beragam tugas
Lisensi
- Jamba dirilis sebagai open weights di bawah lisensi Apache 2.0, dan tersedia di Hugging Face
- Saat ini Jamba dirilis sebagai model riset tanpa pengaman yang diperlukan untuk penggunaan komersial, tetapi AI21 Labs berencana merilis versi yang lebih aman dalam beberapa minggu ke depan
1 komentar
Opini Hacker News