OpenAI merilis GPT-4o mini, model kecil paling hemat biaya

xguru · 2024-07-19T11:52:11+09:00

GPT-4o mini diharapkan akan membuat kecerdasan buatan jauh lebih murah dan secara signifikan memperluas cakupan aplikasi yang dibangun dengan AI Meraih skor 82% di MMLU dan saat ini melampaui GPT-4 dalam preferensi chat di leaderboard LMSYS Harganya 15 sen per 1 juta token input dan 60 sen per 1 juta token output, 10 kali lebih murah daripada model mutakhir sebelumnya dan lebih dari 60% lebih murah daripada GPT-3.5 Turbo Fitur utama GPT-4o mini Dapat menangani berbagai tugas dengan biaya dan latensi rendah Cocok untuk aplikasi yang menghubungkan atau memparalelkan beberapa pemanggilan model (misalnya beberapa pemanggilan API) Cocok untuk aplikasi yang mengirimkan konteks dalam jumlah besar ke model (misalnya seluruh basis kode atau riwayat percakapan) Cocok untuk aplikasi yang bertukar respons teks dengan pelanggan secara cepat dan real-time (misalnya chatbot dukungan pelanggan) Mendukung teks dan visi di API, dan ke depannya akan mendukung input/output teks, gambar, video, dan audio Memiliki context window 128K token, mendukung hingga 16K token output per permintaan, dan memiliki pengetahuan hingga Oktober 2023 Berkat tokenizer yang ditingkatkan dan dibagikan dengan GPT-4o, pemrosesan teks selain bahasa Inggris menjadi lebih hemat biaya Performa unggul GPT-4o mini GPT-4o mini melampaui GPT-3.5 Turbo dan model kecil lainnya dalam kecerdasan teks maupun penalaran multimodal Mendukung cakupan bahasa yang sama dengan GPT-4o Memiliki performa function calling yang sangat baik sehingga developer dapat membangun aplikasi yang mengambil data dari sistem eksternal atau menjalankan tugas Performa konteks panjang meningkat dibandingkan GPT-3.5 Turbo Mencatat skor 82.0% di MMLU, 87.0% di MGSM, 87.2% di HumanEval, dan 59.4% di MMMU, menunjukkan performa yang lebih baik daripada model kecil lainnya Langkah-langkah keamanan Saat pre-training, informasi yang tidak diinginkan untuk dipelajari atau dikeluarkan model (misalnya ujaran kebencian, konten dewasa, situs yang terutama mengumpulkan informasi pribadi, spam, dan sebagainya) difilter Saat post-training, teknik seperti reinforcement learning from human feedback (RLHF) digunakan untuk menyesuaikan perilaku model agar sesuai dengan kebijakan, sehingga meningkatkan akurasi dan keandalan respons model GPT-4o mini memiliki fitur mitigasi keamanan bawaan yang sama dengan GPT-4o Lebih dari 70 pakar eksternal menguji GPT-4o untuk mengidentifikasi potensi risiko, dan OpenAI telah menanganinya serta akan membagikan detailnya dalam GPT-4o system card dan preparedness scorecard GPT-4o mini adalah model pertama di API yang menerapkan metode instruction hierarchy untuk meningkatkan ketahanan model terhadap jailbreak, prompt injection, dan ekstraksi system prompt Harga dan ketersediaan GPT-4o mini kini tersedia sebagai model teks dan visi di Assistants API, Chat Completions API, dan Batch API Developer membayar 15 sen per 1 juta token input dan 60 sen per 1 juta token output Fine-tuning untuk GPT-4o mini dijadwalkan rilis dalam beberapa hari ke depan Pengguna ChatGPT gratis, Plus, dan Team dapat mengakses GPT-4o mini mulai hari ini sebagai pengganti GPT-3.5 Pengguna Enterprise juga akan dapat mengaksesnya mulai minggu depan Rencana ke depan Seiring kemajuan luar biasa dalam kecerdasan AI, terjadi pula pengurangan biaya yang signifikan Biaya per token GPT-4o mini 99% lebih rendah dibandingkan text-davinci-003 yang diperkenalkan pada 2022 OpenAI membayangkan masa depan di mana model terintegrasi mulus ke semua aplikasi dan situs web GPT-4o mini membuka jalan bagi developer untuk membangun dan menskalakan aplikasi AI yang kuat dengan lebih efisien dan lebih murah Masa depan AI menjadi semakin mudah diakses, andal, dan tertanam dalam pengalaman digital sehari-hari kita

(openai.com)

12 poin oleh xguru 2024-07-19 | 1 komentar | Bagikan ke WhatsApp

GPT-4o mini diharapkan akan membuat kecerdasan buatan jauh lebih murah dan secara signifikan memperluas cakupan aplikasi yang dibangun dengan AI
Meraih skor 82% di MMLU dan saat ini melampaui GPT-4 dalam preferensi chat di leaderboard LMSYS
Harganya 15 sen per 1 juta token input dan 60 sen per 1 juta token output, 10 kali lebih murah daripada model mutakhir sebelumnya dan lebih dari 60% lebih murah daripada GPT-3.5 Turbo

Fitur utama GPT-4o mini

Dapat menangani berbagai tugas dengan biaya dan latensi rendah
Cocok untuk aplikasi yang menghubungkan atau memparalelkan beberapa pemanggilan model (misalnya beberapa pemanggilan API)
Cocok untuk aplikasi yang mengirimkan konteks dalam jumlah besar ke model (misalnya seluruh basis kode atau riwayat percakapan)
Cocok untuk aplikasi yang bertukar respons teks dengan pelanggan secara cepat dan real-time (misalnya chatbot dukungan pelanggan)
Mendukung teks dan visi di API, dan ke depannya akan mendukung input/output teks, gambar, video, dan audio
Memiliki context window 128K token, mendukung hingga 16K token output per permintaan, dan memiliki pengetahuan hingga Oktober 2023
Berkat tokenizer yang ditingkatkan dan dibagikan dengan GPT-4o, pemrosesan teks selain bahasa Inggris menjadi lebih hemat biaya

Performa unggul GPT-4o mini

GPT-4o mini melampaui GPT-3.5 Turbo dan model kecil lainnya dalam kecerdasan teks maupun penalaran multimodal
Mendukung cakupan bahasa yang sama dengan GPT-4o
Memiliki performa function calling yang sangat baik sehingga developer dapat membangun aplikasi yang mengambil data dari sistem eksternal atau menjalankan tugas
Performa konteks panjang meningkat dibandingkan GPT-3.5 Turbo
Mencatat skor 82.0% di MMLU, 87.0% di MGSM, 87.2% di HumanEval, dan 59.4% di MMMU, menunjukkan performa yang lebih baik daripada model kecil lainnya

Langkah-langkah keamanan

Saat pre-training, informasi yang tidak diinginkan untuk dipelajari atau dikeluarkan model (misalnya ujaran kebencian, konten dewasa, situs yang terutama mengumpulkan informasi pribadi, spam, dan sebagainya) difilter
Saat post-training, teknik seperti reinforcement learning from human feedback (RLHF) digunakan untuk menyesuaikan perilaku model agar sesuai dengan kebijakan, sehingga meningkatkan akurasi dan keandalan respons model
GPT-4o mini memiliki fitur mitigasi keamanan bawaan yang sama dengan GPT-4o
Lebih dari 70 pakar eksternal menguji GPT-4o untuk mengidentifikasi potensi risiko, dan OpenAI telah menanganinya serta akan membagikan detailnya dalam GPT-4o system card dan preparedness scorecard
GPT-4o mini adalah model pertama di API yang menerapkan metode instruction hierarchy untuk meningkatkan ketahanan model terhadap jailbreak, prompt injection, dan ekstraksi system prompt

Harga dan ketersediaan

GPT-4o mini kini tersedia sebagai model teks dan visi di Assistants API, Chat Completions API, dan Batch API
Developer membayar 15 sen per 1 juta token input dan 60 sen per 1 juta token output
Fine-tuning untuk GPT-4o mini dijadwalkan rilis dalam beberapa hari ke depan
Pengguna ChatGPT gratis, Plus, dan Team dapat mengakses GPT-4o mini mulai hari ini sebagai pengganti GPT-3.5
Pengguna Enterprise juga akan dapat mengaksesnya mulai minggu depan

Rencana ke depan

Seiring kemajuan luar biasa dalam kecerdasan AI, terjadi pula pengurangan biaya yang signifikan
Biaya per token GPT-4o mini 99% lebih rendah dibandingkan text-davinci-003 yang diperkenalkan pada 2022
OpenAI membayangkan masa depan di mana model terintegrasi mulus ke semua aplikasi dan situs web
GPT-4o mini membuka jalan bagi developer untuk membangun dan menskalakan aplikasi AI yang kuat dengan lebih efisien dan lebih murah
Masa depan AI menjadi semakin mudah diakses, andal, dan tertanam dalam pengalaman digital sehari-hari kita

1 komentar

wedding 2024-07-22

Sepertinya nanti juga akan keluar gpt-4o pro max ultra.