- Mistral memperkenalkan Pixtral 12B, model pertamanya yang dapat memproses gambar dan teks
- Model berukuran sekitar 24GB dengan 12 miliar parameter
- Dibangun berdasarkan Nemo 12B, model teks milik Mistral
- Dapat menjawab pertanyaan tentang sejumlah gambar dengan jumlah dan ukuran berapa pun melalui URL atau gambar yang dienkode dalam base64
- Diperkirakan dapat melakukan tugas seperti pembuatan caption gambar dan menghitung jumlah objek dalam foto, mirip dengan model multimodal lain seperti lini Claude dari Anthropic atau GPT-4 dari OpenAI
- Tersedia untuk diunduh di GitHub dan Hugging Face melalui tautan torrent
- Dapat diunduh, di-fine-tune, dan digunakan tanpa batasan sesuai lisensi Apache 2.0
- Demo web saat ini belum berfungsi, tetapi akan segera dapat diuji di Le Chat dan Le Plateforme, platform chatbot dan layanan API milik Mistral
- Baru-baru ini, Mistral menutup putaran pendanaan senilai $645 juta yang dipimpin General Catalyst, dengan valuasi perusahaan sebesar $6 miliar
- Mistral yang baru berusia sedikit lebih dari satu tahun ini dimiliki sebagian kecil oleh Microsoft dan dianggap sebagai OpenAI-nya Eropa
- Perusahaan ini menjalankan strategi dengan merilis model gratis yang "terbuka", mengenakan biaya untuk versi terkelola, dan menyediakan layanan konsultasi bagi pelanggan enterprise
Belum ada komentar.