Fine-tuning Mistral 7B pada draft Magic: The Gathering
(generallyintelligent.substack.com)Ringkasan: Menjelajahi teknik fine-tuning AI
- Efektivitas dan tingkat kesulitan teknik fine-tuning
- Fine-tuning melengkapi kemampuan GPT-4 dan menjanjikan efisiensi kecepatan serta biaya.
- Untuk mengatasi kurangnya informasi tentang seberapa efektif dan sulit fine-tuning dalam praktik, penulis melakukan eksperimen langsung.
Memilih masalah
- Menguji kemampuan penalaran model melalui draft Magic: The Gathering (MTG)
- MTG adalah permainan kartu strategis, dan draft adalah metode membangun dek dengan memilih kartu dari kumpulan kartu acak.
- Draft cocok sebagai tugas yang kompleks karena membutuhkan penalaran dan pemahaman terhadap data baru.
- Menggunakan data historis berskala besar yang disediakan oleh layanan bernama 17lands, pilihan draft para pemain terbaik dipakai sebagai "ground truth".
Hasil dan ringkasan
- Kinerja model 7B yang di-fine-tune
- Model 7B yang di-fine-tune melampaui GPT-4 dan menunjukkan kinerja yang mendekati tingkat manusia.
- Fine-tuning GPT-3.5 mungkin menghasilkan hasil yang lebih baik, tetapi biayanya sangat tinggi.
- Fine-tuning masih merupakan proses eksperimental, terutama karena prompt engineering memakan banyak waktu.
- Setelah fine-tuning pada set kartu baru, model juga menunjukkan kemampuan generalisasi pada set kartu yang belum pernah dilihat.
Laporan lapangan: metode dan proses pembelajaran
- Membangun data
- Data format file CSV dari 17lands diubah ke format teks agar cocok untuk fine-tuning.
- Pemformatan data merupakan proses yang menantang dan eksperimental.
- Menjalankan fine-tuning
- Karena masalah akses GPU, GPU per jam disewa dari Runpod.
- Menggunakan axolotl untuk menerapkan optimasi fine-tuning dengan lebih mudah.
- Evaluasi
- Penting untuk menyiapkan kriteria evaluasi sebelum memulai eksperimen.
- Menetapkan kriteria evaluasi untuk model bahasa bisa menjadi hal yang sulit.
Pelajaran utama
- Efek fine-tuning
- Fine-tuning pada data baru lebih unggul daripada GPT-4 dari sisi akurasi dan biaya.
- Fine-tuning membutuhkan proses eksperimental agar dapat dilakukan dengan benar, dan merupakan keahlian khusus yang lebih sulit dipelajari dibanding prompt engineering.
Informasi tambahan terkait Magic
- Kinerja bot draft AI yang di-fine-tune
- Dikembangkan aplikasi pendamping draft yang terhubung ke log Magic Arena menggunakan model draft.
- Model yang di-fine-tune menghasilkan pilihan, sementara GPT-4 memberikan penjelasan.
- Dengan mensimulasikan beberapa bot draft AI, model menunjukkan kinerja yang mirip dengan drafter manusia.
Opini GN⁺
Poin terpenting dari tulisan ini adalah bahwa teknik fine-tuning memiliki potensi untuk melampaui performa model bahasa besar yang ada (seperti GPT-4), dan melalui hal itu dapat secara signifikan meningkatkan tingkat pemahaman serta efisiensi AI untuk tugas tertentu. Tulisan ini menarik karena memperlihatkan proses konkret fine-tuning dan efeknya melalui contoh penerapan nyata, yang juga dapat membantu insinyur perangkat lunak pemula memahami potensi perkembangan teknologi AI dan cara penerapannya.
1 komentar
Komentar Hacker News