19 poin oleh xguru 2023-03-31 | Belum ada komentar. | Bagikan ke WhatsApp
  • Model bahasa besar bergaya asisten
  • Data yang dikumpulkan, prosedur pengumpulan data, kode pelatihan, bobot model akhir, dan lainnya semuanya dibuka ke publik
  • Dilatih dengan 800k data (kode/cerita/percakapan) yang dihasilkan oleh GPT 3.5 Turbo
    • Menggunakan LAION OIG, pertanyaan pemrograman dari Stack Overflow, serta instruction tuning dari Big-Science/P3 sebagai dataset dasar
    • Merujuk pada Stanford Alpaca dan lainnya, lalu mengunggah data ke ATLAS untuk proses kurasi dan pembersihan

Belum ada komentar.

Belum ada komentar.