11 poin oleh xguru 2023-03-15 | Belum ada komentar. | Bagikan ke WhatsApp

Stanford's Alpaca

  • Kelemahan besar model LLaMA adalah kurangnya "instruction tuning" untuk tanya-jawab
  • Salah satu inovasi besar OpenAI adalah menambahkan instruction tuning ke GPT-3
  • Stanford menyediakan 52.000 contoh pelatihan untuk ini dan membuatnya bisa dilatih hanya dengan biaya $100
  • Model 7B terkecil kini bahkan bisa berjalan di Raspberry Pi/ponsel, dan menghasilkan hasil yang sangat mengesankan
  • Namun, ini masih belum untuk penggunaan komersial (tidak memungkinkan karena 3 alasan: lisensi LLaMA/data instruction set dibuat dari model OpenAI/tidak merancang langkah pengamanan)

Apa artinya ini?

  • Model lisensi LLaMA tidak terlalu relevan bagi saya
  • LLaMA menunjukkan bahwa model bahasa kelas GPT-3 bisa dilatih dengan sumber daya yang secara umum tersedia
  • llama.cpp menunjukkan bahwa LLM bisa dijalankan pada hardware konsumen dengan kelas 4GB
  • Alpaca menunjukkan bahwa dengan 52K contoh dan biaya $100, model 7B (dikurangi menjadi 4GB dengan kuantisasi 4bit) bisa di-fine-tune dan menghasilkan hasil yang mirip dengan text-davinci-003 terbaru
    • Yang digunakan untuk perbandingan adalah model penuh 7B (13,48GB, floating point 16bit), bukan model 4GB yang diperkecil ke 4bit, tetapi saya belum melihat data yang benar-benar membandingkan perbedaan kualitas di antara keduanya

Belum ada komentar.

Belum ada komentar.