- Di HN, minat terhadap fine-tuning LLM open source meningkat pesat (misalnya: postingan Anyscale)
- Berbagi pengalaman, wawasan, dan kode praktis dari beberapa tahun bekerja dengan fine-tuning model
- Menyediakan sekumpulan notebook yang membahas pelabelan data, fine-tuning, menjalankan inferensi secara efisien, serta evaluasi biaya/kinerja
- Melatih model 7B yang mencocokkan label GPT-4 hingga 95% pada test set
- Apa itu fine-tuning? Bentuk prompting yang lebih kuat daripada sekadar menulis instruksi dalam teks
- Fine-tuning melatih model yang sudah ada menggunakan pasangan input/output contoh untuk pembelajaran model yang disetel
- Kelebihan dan kekurangan prompting dan fine-tuning
- Keunggulan besar fine-tuning: jauh lebih efektif untuk mengarahkan perilaku model, sehingga model yang jauh lebih kecil pun sudah memadai
- Model Llama 7B yang sudah di-fine-tune 50 kali lebih murah per token daripada GPT-3.5, dan memberikan hasil yang sama atau lebih baik untuk banyak use case
- Contoh: mengklasifikasikan 2M resep dengan GPT-4 memerlukan biaya $23k, tetapi model yang kami fine-tune menunjukkan performa serupa GPT-4 dan hanya memerlukan biaya $19 untuk menjalankan seluruh dataset
- Sedang mengembangkan produk open source bernama OpenPipe
- Produk OpenPipe membantu engineer mengadopsi fine-tuning sesederhana mungkin
- Postingan ini dibuat untuk membagikan hal-hal yang dipelajari tentang fine-tuning
1 komentar
Komentar Hacker News