Alpaca: Model Instruction-Following Open Source yang Kuat Setingkat GPT-3.5

xguru · 2023-03-14T11:21:01+09:00

Stanford CRFM melakukan fine-tuning Meta LLaMA 7B dengan 52K data Instruction-Following Berperilaku mirip dengan GPT-3.5 (text-davinci-003) milik OpenAI, tetapi jauh lebih kecil dan murah Resep pelatihan dan datanya dibuka, dan bobot model juga direncanakan akan dirilis nanti Dirilis hanya untuk tujuan penelitian, dan penggunaan komersial dilarang Fine-tuning memakan waktu 3 jam pada 8 A100 80GB, dan dapat dilakukan di cloud dengan biaya kurang dari sekitar 100 dolar

(crfm.stanford.edu)

19 poin oleh xguru 2023-03-14 | 1 komentar | Bagikan ke WhatsApp

Stanford CRFM melakukan fine-tuning Meta LLaMA 7B dengan 52K data Instruction-Following
Berperilaku mirip dengan GPT-3.5 (text-davinci-003) milik OpenAI, tetapi jauh lebih kecil dan murah
Resep pelatihan dan datanya dibuka, dan bobot model juga direncanakan akan dirilis nanti
Dirilis hanya untuk tujuan penelitian, dan penggunaan komersial dilarang
Fine-tuning memakan waktu 3 jam pada 8 A100 80GB, dan dapat dilakukan di cloud dengan biaya kurang dari sekitar 100 dolar

1 komentar

xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/

Perilisan LLaMA benar-benar sedang menciptakan momen Stable Diffusion. Perubahannya berlangsung sangat cepat.

Alpaca: Model Instruction-Following Open Source yang Kuat Setingkat GPT-3.5

Bacaan terkait

1 komentar