Alpaca: Model Instruction-Following Open Source yang Kuat Setingkat GPT-3.5
(crfm.stanford.edu)- Stanford CRFM melakukan fine-tuning Meta LLaMA 7B dengan 52K data Instruction-Following
- Berperilaku mirip dengan GPT-3.5 (text-davinci-003) milik OpenAI, tetapi jauh lebih kecil dan murah
- Resep pelatihan dan datanya dibuka, dan bobot model juga direncanakan akan dirilis nanti
- Dirilis hanya untuk tujuan penelitian, dan penggunaan komersial dilarang
- Fine-tuning memakan waktu 3 jam pada 8 A100 80GB, dan dapat dilakukan di cloud dengan biaya kurang dari sekitar 100 dolar
1 komentar
Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/
Perilisan LLaMA benar-benar sedang menciptakan momen Stable Diffusion. Perubahannya berlangsung sangat cepat.