1 poin oleh GN⁺ 2023-08-23 | 1 komentar | Bagikan ke WhatsApp
  • OpenAI mengumumkan fine-tuning dan pembaruan API untuk GPT-3.5 Turbo, yang memungkinkan pengembang menyesuaikan model untuk kasus penggunaan tertentu.
  • Fine-tuning untuk GPT-4 diperkirakan akan tersedia pada musim gugur.
  • Dalam pengujian awal, GPT-3.5 Turbo yang telah di-fine-tune menunjukkan bahwa pada tugas tertentu, performanya dapat melampaui atau setara dengan performa dasar GPT-4.
  • Data yang dikirim melalui API fine-tuning dimiliki oleh pelanggan, dan tidak digunakan oleh OpenAI maupun organisasi lain untuk melatih model lain.
  • Fine-tuning telah digunakan untuk meningkatkan performa model pada kasus penggunaan umum seperti kontrol yang lebih baik, format output yang andal, dan nada yang disesuaikan.
  • Fine-tuning memungkinkan bisnis mempersingkat prompt sambil tetap memastikan performa serupa, serta menangani 4k token, dua kali lipat dibanding model fine-tuning sebelumnya.
  • Fine-tuning paling efektif bila dikombinasikan dengan teknik seperti prompt engineering, pengambilan informasi, dan pemanggilan fungsi.
  • Biaya fine-tuning dibagi menjadi dua: biaya pelatihan awal dan biaya penggunaan.
  • OpenAI juga menyediakan babbage-002 dan davinci-002 sebagai pengganti model dasar GPT-3 asli, dan keduanya dapat di-fine-tune melalui endpoint API baru.
  • Endpoint /v1/fine-tunes yang lama dijadwalkan akan dihentikan pada 4 Januari 2024.
  • OpenAI juga berupaya memastikan keamanan deployment fine-tuning, dan data pelatihan fine-tuning diperiksa melalui Moderation API mereka serta sistem moderasi berbasis GPT-4 untuk mendeteksi data pelatihan yang tidak aman.
  • Dalam waktu dekat, UI fine-tuning akan dirilis sehingga pengembang dapat lebih mudah mengakses informasi tentang pekerjaan fine-tuning yang sedang berlangsung dan snapshot model yang telah selesai.

1 komentar

 
GN⁺ 2023-08-23
Opini Hacker News
  • OpenAI, sesuai janji, merilis fine-tuning GPT-3.5 beberapa bulan setelah membuka akses API GPT-4.
  • Meski dikritik karena tidak cukup terbuka, OpenAI diakui karena inovasinya yang cepat, melampaui AI open source lain seperti Llama dan Bard.
  • Biaya pembuatan dengan GPT-3.5 Turbo yang telah di-fine-tune 8 kali lebih tinggi daripada model dasar, sehingga hanya hemat biaya bagi mereka yang bisa mengurangi ukuran prompt secara signifikan.
  • Ada permintaan perbandingan antara GPT-3.5 Turbo yang telah di-fine-tune dan model Llama2, yang terakhir memerlukan infrastruktur sewaan.
  • Sebagian pengguna merasa GPT-3.5 Turbo repetitif dan tidak akurat sehingga tidak cocok untuk menulis dan coding, sementara pengguna lain merasa GPT-4 jauh lebih baik dan berguna sebagai alat bantu pendidikan atau pemecahan masalah.
  • Fitur yang diinginkan di kalangan pengguna adalah pemecahan prompt bawaan untuk menghilangkan kebutuhan akan alat pihak ketiga.
  • Keputusan OpenAI untuk tidak menyediakan model yang "tidak aman" juga mendapat perhatian, dan baik davinci-002 maupun babbage-002 masuk ke loop tak berujung pada penyelesaian yang "tidak aman".
  • Data pelatihan fine-tuning melewati Moderation API milik OpenAI dan sistem sensor berbasis GPT-4, yang diduga hanya digunakan saat "keamanan" ambigu karena biayanya tinggi.
  • Muncul pertanyaan tentang cara menghitung jumlah token yang diperlukan untuk pekerjaan fine-tuning, dan secara umum berapa banyak data fine-tuning yang dibutuhkan untuk secara efektif memengaruhi perilaku model dasar.
  • Kemampuan untuk melakukan fine-tuning pada model "Chat" dianggap menarik, dan muncul pertanyaan tentang kemungkinan menggunakan model yang telah di-fine-tune untuk mengakali detektor AI saat ini.
  • Kekhawatiran tentang privasi telah disampaikan, termasuk pertanyaan tentang berapa lama OpenAI atau Microsoft menyimpan teks dari panggilan API.
  • Secara keseluruhan, peluncuran fine-tuning GPT-3.5 Turbo dipandang sebagai perkembangan positif, dengan adanya harapan terhadap fine-tuning 16k.