GPT4All - Chatbot berbasis LLaMA yang dilatih dengan 800k set instruksi
(github.com/nomic-ai)- Model bahasa besar bergaya asisten
- Data yang dikumpulkan, prosedur pengumpulan data, kode pelatihan, bobot model akhir, dan lainnya semuanya dibuka ke publik
- Dilatih dengan 800k data (kode/cerita/percakapan) yang dihasilkan oleh GPT 3.5 Turbo
- Menggunakan LAION OIG, pertanyaan pemrograman dari Stack Overflow, serta instruction tuning dari Big-Science/P3 sebagai dataset dasar
- Merujuk pada Stanford Alpaca dan lainnya, lalu mengunggah data ke ATLAS untuk proses kurasi dan pembersihan
Belum ada komentar.