Peluncuran beta layanan platform baru dari Mistral AI
- Mistral AI menyediakan model generatif terbuka yang kuat untuk para pengembang, beserta cara untuk menerapkan dan menyesuaikannya secara efisien.
- Hari ini dimulai akses beta untuk layanan platform pertamanya yang menyediakan tiga endpoint chatbot yang menghasilkan teks berdasarkan instruksi teks, serta endpoint embedding.
- Setiap endpoint memiliki trade-off performa/harga yang berbeda.
Endpoint generatif
- 'mistral-tiny' dan 'mistral-small' menggunakan dua model yang saat ini sudah dipublikasikan, sementara 'mistral-medium' menggunakan model prototipe yang sedang diuji di lingkungan deployment.
- Model-model ini mengintegrasikan teknik alignment yang paling efektif, seperti fine-tuning yang efisien dan direct preference optimization, untuk membuat model yang mudah dikendalikan pengguna dan menyenangkan untuk digunakan.
- 'Mistral-tiny' hanya mendukung bahasa Inggris, 'Mistral-small' mendukung banyak bahasa dan kode, dan 'Mistral-medium' dinilai sebagai salah satu model layanan papan atas.
Endpoint embedding
- 'Mistral-embed' menyediakan model embedding yang dirancang dengan fungsi pencarian sebagai fokus, dengan dimensi embedding 1024.
- Model embedding ini mencapai skor pencarian 55.26 di MTEB.
Spesifikasi API
- API mengikuti spesifikasi antarmuka chatbot populer yang pertama kali diajukan oleh pesaing.
- Tersedia library klien Python dan Javascript untuk melakukan kueri ke endpoint.
- Endpoint menyediakan system prompt agar pengguna dapat menetapkan tingkat moderasi yang lebih tinggi terhadap output model.
Dari akses beta menuju ketersediaan umum
- Mulai hari ini, siapa pun dapat mendaftar dan menggunakan API, dan kapasitas akan ditingkatkan secara bertahap.
- Tim bisnis dapat membantu memahami kebutuhan dan mempercepat akses.
- Mungkin masih ada bagian yang belum stabil selama proses menstabilkan platform agar sepenuhnya siap self-service.
Ucapan terima kasih
- Terima kasih kepada NVIDIA yang telah mendukung integrasi TensorRT-LLM dan Triton, serta bekerja bersama dalam membuat sparse mixture of experts yang kompatibel dengan TRT-LLM.
Opini GN⁺
- Hal terpenting dalam artikel ini adalah bahwa Mistral AI menyediakan model generatif baru dan model embedding kepada para pengembang, sehingga mereka dapat memanfaatkan kemampuan pembuatan teks dan embedding yang lebih baik.
- Teknologi ini akan mendorong kemajuan kecerdasan buatan, dan kemampuan untuk mendukung berbagai bahasa serta kode akan sangat memperluas kemungkinan penerapannya di pasar global.
- Bagi pengembang, ini menghadirkan peluang menarik untuk mengembangkan proyek dan solusi kreatif melalui alat dan API baru, dan menjadi kabar yang meningkatkan ekspektasi terhadap masa depan teknologi.
1 komentar
Komentar Hacker News