- Membuat aplikasi eksplorasi karier berbasis AI, lalu saat pertumbuhannya meledak, biaya GPT-4 mulai melebihi $100 per hari
- Metode yang digunakan untuk menurunkan biaya AI hingga 99% sambil mengurangi latensi dan mempertahankan kualitas
- Menggunakan model paling kuat (GPT-4) untuk menghasilkan output, lalu memakai hasil tersebut untuk melakukan fine-tuning pada model yang lebih kecil
- Menyimpan permintaan/respons AI agar mudah diekspor. Menggunakan Helicone AI. Cukup mengganti OpenAI API apa adanya, lalu permintaan AI akan disimpan ke tabel
- Setelah sekitar 100~500 pasangan permintaan/respons tersimpan, ekspor lalu kurasi datanya dengan kualitas yang baik
- Menggunakan dataset ini untuk melakukan fine-tuning Mixtral 8x7B melalui layanan hosting seperti Together/Anyscale
- Mengganti GPT-4 dengan model yang baru di-fine-tuning
4 komentar
Jadi ini berarti keduanya melanggar ketentuan GPT-4 dan lisensi Mixtral...?_@
Sepertinya memang begitu. Karena ini tidak terlihat secara jelas, banyak orang tampaknya berpikir seperti itu.
Ada yang sudah dipakai diam-diam atau dirilis untuk keperluan riset,
but kalau sampai terang-terangan dipromosikan dengan bilang, "kami memakainya!", ini memang agak... menarik ya.
Jangan-jangan nanti kena masalah...?
Komentar Hacker News