- GPT-4o mini diharapkan akan membuat kecerdasan buatan jauh lebih murah dan secara signifikan memperluas cakupan aplikasi yang dibangun dengan AI
- Meraih skor 82% di MMLU dan saat ini melampaui GPT-4 dalam preferensi chat di leaderboard LMSYS
- Harganya 15 sen per 1 juta token input dan 60 sen per 1 juta token output, 10 kali lebih murah daripada model mutakhir sebelumnya dan lebih dari 60% lebih murah daripada GPT-3.5 Turbo
Fitur utama GPT-4o mini
- Dapat menangani berbagai tugas dengan biaya dan latensi rendah
- Cocok untuk aplikasi yang menghubungkan atau memparalelkan beberapa pemanggilan model (misalnya beberapa pemanggilan API)
- Cocok untuk aplikasi yang mengirimkan konteks dalam jumlah besar ke model (misalnya seluruh basis kode atau riwayat percakapan)
- Cocok untuk aplikasi yang bertukar respons teks dengan pelanggan secara cepat dan real-time (misalnya chatbot dukungan pelanggan)
- Mendukung teks dan visi di API, dan ke depannya akan mendukung input/output teks, gambar, video, dan audio
- Memiliki context window 128K token, mendukung hingga 16K token output per permintaan, dan memiliki pengetahuan hingga Oktober 2023
- Berkat tokenizer yang ditingkatkan dan dibagikan dengan GPT-4o, pemrosesan teks selain bahasa Inggris menjadi lebih hemat biaya
Performa unggul GPT-4o mini
- GPT-4o mini melampaui GPT-3.5 Turbo dan model kecil lainnya dalam kecerdasan teks maupun penalaran multimodal
- Mendukung cakupan bahasa yang sama dengan GPT-4o
- Memiliki performa function calling yang sangat baik sehingga developer dapat membangun aplikasi yang mengambil data dari sistem eksternal atau menjalankan tugas
- Performa konteks panjang meningkat dibandingkan GPT-3.5 Turbo
- Mencatat skor 82.0% di MMLU, 87.0% di MGSM, 87.2% di HumanEval, dan 59.4% di MMMU, menunjukkan performa yang lebih baik daripada model kecil lainnya
Langkah-langkah keamanan
- Saat pre-training, informasi yang tidak diinginkan untuk dipelajari atau dikeluarkan model (misalnya ujaran kebencian, konten dewasa, situs yang terutama mengumpulkan informasi pribadi, spam, dan sebagainya) difilter
- Saat post-training, teknik seperti reinforcement learning from human feedback (RLHF) digunakan untuk menyesuaikan perilaku model agar sesuai dengan kebijakan, sehingga meningkatkan akurasi dan keandalan respons model
- GPT-4o mini memiliki fitur mitigasi keamanan bawaan yang sama dengan GPT-4o
- Lebih dari 70 pakar eksternal menguji GPT-4o untuk mengidentifikasi potensi risiko, dan OpenAI telah menanganinya serta akan membagikan detailnya dalam GPT-4o system card dan preparedness scorecard
- GPT-4o mini adalah model pertama di API yang menerapkan metode instruction hierarchy untuk meningkatkan ketahanan model terhadap jailbreak, prompt injection, dan ekstraksi system prompt
Harga dan ketersediaan
- GPT-4o mini kini tersedia sebagai model teks dan visi di Assistants API, Chat Completions API, dan Batch API
- Developer membayar 15 sen per 1 juta token input dan 60 sen per 1 juta token output
- Fine-tuning untuk GPT-4o mini dijadwalkan rilis dalam beberapa hari ke depan
- Pengguna ChatGPT gratis, Plus, dan Team dapat mengakses GPT-4o mini mulai hari ini sebagai pengganti GPT-3.5
- Pengguna Enterprise juga akan dapat mengaksesnya mulai minggu depan
Rencana ke depan
- Seiring kemajuan luar biasa dalam kecerdasan AI, terjadi pula pengurangan biaya yang signifikan
- Biaya per token GPT-4o mini 99% lebih rendah dibandingkan text-davinci-003 yang diperkenalkan pada 2022
- OpenAI membayangkan masa depan di mana model terintegrasi mulus ke semua aplikasi dan situs web
- GPT-4o mini membuka jalan bagi developer untuk membangun dan menskalakan aplikasi AI yang kuat dengan lebih efisien dan lebih murah
- Masa depan AI menjadi semakin mudah diakses, andal, dan tertanam dalam pengalaman digital sehari-hari kita
1 komentar
Sepertinya nanti juga akan keluar gpt-4o pro max ultra.