Gemma — model terbuka mutakhir dari Google
(blog.google)- Google meyakini pembuatan AI yang bermanfaat untuk semua orang, dan telah berkontribusi menghadirkan inovasi bagi komunitas terbuka melalui hal-hal seperti Transformers, TensorFlow, BERT, T5, JAX, AlphaFold, dan AlphaCode
- Gemma adalah keluarga model terbuka ringan yang mutakhir, dibuat berdasarkan riset dan teknologi yang sama yang digunakan untuk membangun model Gemini
- Dikembangkan oleh Google DeepMind dan tim lainnya, serta terinspirasi dari 'gemma', yang dalam bahasa Latin berarti 'permata'
- Mulai hari ini tersedia secara global, bersama bobot model, alat untuk mendukung inovasi pengembang, mendorong kolaborasi, dan memandu penggunaan model Gemma secara bertanggung jawab
- Dengan berbagi komponen teknologi dan infrastruktur dengan Gemini, Gemma 2B dan 7B mencapai performa terbaik di kelasnya dibanding ukuran model saat dibandingkan dengan model terbuka lain
- Dapat dijalankan langsung di laptop atau komputer desktop pengembang, serta mematuhi standar ketat untuk memberikan keluaran yang aman dan bertanggung jawab sambil melampaui model yang jauh lebih besar pada benchmark utama
- Menyediakan toolchain untuk inferensi dan SFT (supervised fine-tuning) di semua framework utama seperti JAX, PyTorch, dan TensorFlow melalui Native Keras 3.0
- Mudah memulai Gemma melalui integrasi dengan notebook Colab dan Kaggle serta alat populer seperti Hugging Face, MaxText, NVIDIA NeMo, dan TensorRT-LLM
- Model Gemma yang telah dipra-latih dan di-tuning untuk instruksi dapat dengan mudah di-deploy ke Vertex AI dan Google Kubernetes Engine (GKE) untuk dijalankan di notebook, workstation, atau Google Cloud
- Menjamin performa kelas industri terbaik melalui optimasi untuk berbagai platform hardware AI, termasuk NVIDIA GPU dan Google Cloud TPU
- Mengizinkan penggunaan dan distribusi komersial bagi semua organisasi, apa pun skalanya, sesuai ketentuan penggunaan
Dirancang secara bertanggung jawab
- Gemma dirancang dengan prinsip AI sebagai prioritas utama, serta menggunakan teknik otomatis untuk menyaring informasi pribadi dan data sensitif lainnya dari set pelatihan
- Selain itu, secara luas menggunakan reinforcement learning from human feedback (RLHF) untuk model yang di-tuning dengan instruksi agar selaras dengan perilaku yang bertanggung jawab
- Dilakukan evaluasi yang kuat untuk memahami dan mengurangi profil risiko model Gemma, termasuk red teaming manual, pengujian adversarial otomatis, dan evaluasi kemampuan model terhadap aktivitas berbahaya
Dioptimalkan di berbagai framework, alat, dan hardware
- Model Gemma dapat di-fine-tune pada data Anda sendiri agar sesuai dengan kebutuhan aplikasi tertentu, serta mendukung beragam alat dan sistem
- Alat multi-framework: tersedia framework pilihan seperti Keras 3.0, PyTorch native, JAX, dan Hugging Face Transformers. Menyediakan implementasi referensi
- Kompatibilitas lintas perangkat: dapat dijalankan di perangkat populer termasuk laptop, desktop, IoT, mobile, dan cloud
- Platform hardware mutakhir: melalui kemitraan dengan NVIDIA, optimasi untuk NVIDIA GPU dari data center hingga cloud dan RTX AI PC lokal menjamin performa terbaik di industri serta integrasi dengan teknologi mutakhir
- Optimasi di Google Cloud: menggunakan Vertex AI untuk menyediakan rangkaian alat MLOps yang luas dan berbagai opsi tuning, serta memungkinkan deployment sekali klik dengan optimasi inferensi bawaan
Kredit gratis untuk riset dan pengembangan
- Gemma dibangun untuk komunitas pengembang dan peneliti yang mendorong inovasi AI, dan Anda dapat mulai bekerja mulai hari ini dengan akses gratis di Kaggle, tier gratis notebook Colab, serta kredit $300 bagi pengguna pertama Google Cloud
- Peneliti dapat mengajukan hingga $500,000 kredit Google Cloud untuk mempercepat proyek mereka
2 komentar
Sekarang situasinya jadi hanya OpenAI yang tertutup.
Komentar Hacker News
feedforward hidden sizesebesar 16 kalid_model, berbeda dari kebanyakan model yang hanya 4 kali.