19 poin oleh xguru 2023-03-14 | 1 komentar | Bagikan ke WhatsApp
  • Stanford CRFM melakukan fine-tuning Meta LLaMA 7B dengan 52K data Instruction-Following
  • Berperilaku mirip dengan GPT-3.5 (text-davinci-003) milik OpenAI, tetapi jauh lebih kecil dan murah
  • Resep pelatihan dan datanya dibuka, dan bobot model juga direncanakan akan dirilis nanti
  • Dirilis hanya untuk tujuan penelitian, dan penggunaan komersial dilarang
  • Fine-tuning memakan waktu 3 jam pada 8 A100 80GB, dan dapat dilakukan di cloud dengan biaya kurang dari sekitar 100 dolar

1 komentar

 
xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/

Perilisan LLaMA benar-benar sedang menciptakan momen Stable Diffusion. Perubahannya berlangsung sangat cepat.