Mengganti GPT-3.5/4 dengan Llama 2 yang Difine-tune Sendiri
(news.ycombinator.com)- Saat Llama 2 7B difine-tune pada contoh klasifikasi resep, hasilnya 95% cocok dengan label GPT-4 berdasarkan set uji
- Fine-tuning adalah cara melatih bobot model dengan cara kerja tugas yang diinginkan melalui contoh input/output; bisa dilakukan dengan 50 contoh, tetapi biasanya menargetkan 1.000 contoh atau lebih
- Prompt unggul untuk iterasi cepat dan pengoperasian satu model besar, tetapi fine-tuning memungkinkan model kecil pun disesuaikan dengan kuat untuk tugas tertentu
- Llama 7B yang difine-tune memiliki biaya per token 50 kali lebih murah daripada GPT-3.5, sehingga pada tugas yang cukup sempit, rasio biaya terhadap performanya bisa meningkat jauh
- Biaya klasifikasi 2 juta resep adalah 23 ribu dolar AS dengan GPT-4 dan lebih dari 1.000 dolar AS dengan GPT-3.5, sedangkan model fine-tuning tersebut memproses seluruh dataset hanya dengan 19 dolar AS
Titik Perbedaan Fine-tuning dan Prompt
- Di tengah meningkatnya minat terhadap fine-tuning LLM terbuka di Hacker News, satu set notebook untuk contoh klasifikasi resep telah dirilis
- Notebook tersedia di contoh OpenPipe, dan membahas pelabelan data, fine-tuning, menjalankan inferensi secara efisien, serta evaluasi biaya/performa
- Fine-tuning dapat dilihat sebagai bentuk instruksi yang lebih kuat dibanding prompt
- Alih-alih memasukkan instruksi teks ke dalam prompt setiap kali, cara kerja tugas dilatih ke dalam model itu sendiri melalui pasangan contoh input/output
- Bisa bekerja hanya dengan 50 contoh, tetapi jika memungkinkan lebih disukai mengumpulkan 1.000 contoh atau lebih
- Prompt masih memiliki keunggulan besar dalam operasi dan eksperimen
- Instruksi dapat diiterasi dan diperbaiki dengan lebih mudah dan cepat tanpa pelabelan dan pelatihan ulang
- Dari sisi operasional, menerapkan satu model besar lalu hanya menyesuaikan perilakunya lebih sederhana daripada menerapkan beberapa model fine-tuning kecil
- Model-model fine-tuning kecil masing-masing berpotensi memiliki tingkat pemakaian yang rendah
Contoh Biaya·Performa dan OpenPipe
- Manfaat terbesar fine-tuning adalah kemampuannya mengarahkan perilaku model dengan lebih efektif sehingga dapat menggunakan model kecil
- Model kecil dapat meningkatkan kecepatan respons dan menurunkan biaya inferensi
- Model Llama 7B yang difine-tune 50 kali lebih murah daripada GPT-3.5 berdasarkan biaya per token
- Contoh klasifikasi resep membandingkan biaya untuk 2 juta resep dari dataset all-recipes
- Jika diklasifikasikan dengan GPT-4, biayanya 23 ribu dolar AS
- Dengan GPT-3.5 pun, biayanya lebih dari 1.000 dolar AS
- Model yang difine-tune menghasilkan performa yang mirip dengan GPT-4, dengan biaya menjalankan seluruh dataset sebesar 19 dolar AS
- Pada set uji, model 7B yang dilatih 95% cocok dengan label GPT-4
- Pada 5% kasus yang tidak cocok, jawabannya sering kali memang ambigu
- OpenPipe adalah produk open-source yang membantu engineer mengadopsi fine-tuning dengan lebih mudah
- Proyek ini tersedia di repositori GitHub OpenPipe
- Informasi fine-tuning yang diberikan itu sendiri tidak bergantung pada produk OpenPipe
1 komentar
Komentar Hacker News