12 poin oleh xguru 2024-07-19 | 1 komentar | Bagikan ke WhatsApp
  • GPT-4o mini diharapkan akan membuat kecerdasan buatan jauh lebih murah dan secara signifikan memperluas cakupan aplikasi yang dibangun dengan AI
  • Meraih skor 82% di MMLU dan saat ini melampaui GPT-4 dalam preferensi chat di leaderboard LMSYS
  • Harganya 15 sen per 1 juta token input dan 60 sen per 1 juta token output, 10 kali lebih murah daripada model mutakhir sebelumnya dan lebih dari 60% lebih murah daripada GPT-3.5 Turbo

Fitur utama GPT-4o mini

  • Dapat menangani berbagai tugas dengan biaya dan latensi rendah
  • Cocok untuk aplikasi yang menghubungkan atau memparalelkan beberapa pemanggilan model (misalnya beberapa pemanggilan API)
  • Cocok untuk aplikasi yang mengirimkan konteks dalam jumlah besar ke model (misalnya seluruh basis kode atau riwayat percakapan)
  • Cocok untuk aplikasi yang bertukar respons teks dengan pelanggan secara cepat dan real-time (misalnya chatbot dukungan pelanggan)
  • Mendukung teks dan visi di API, dan ke depannya akan mendukung input/output teks, gambar, video, dan audio
  • Memiliki context window 128K token, mendukung hingga 16K token output per permintaan, dan memiliki pengetahuan hingga Oktober 2023
  • Berkat tokenizer yang ditingkatkan dan dibagikan dengan GPT-4o, pemrosesan teks selain bahasa Inggris menjadi lebih hemat biaya

Performa unggul GPT-4o mini

  • GPT-4o mini melampaui GPT-3.5 Turbo dan model kecil lainnya dalam kecerdasan teks maupun penalaran multimodal
  • Mendukung cakupan bahasa yang sama dengan GPT-4o
  • Memiliki performa function calling yang sangat baik sehingga developer dapat membangun aplikasi yang mengambil data dari sistem eksternal atau menjalankan tugas
  • Performa konteks panjang meningkat dibandingkan GPT-3.5 Turbo
  • Mencatat skor 82.0% di MMLU, 87.0% di MGSM, 87.2% di HumanEval, dan 59.4% di MMMU, menunjukkan performa yang lebih baik daripada model kecil lainnya

Langkah-langkah keamanan

  • Saat pre-training, informasi yang tidak diinginkan untuk dipelajari atau dikeluarkan model (misalnya ujaran kebencian, konten dewasa, situs yang terutama mengumpulkan informasi pribadi, spam, dan sebagainya) difilter
  • Saat post-training, teknik seperti reinforcement learning from human feedback (RLHF) digunakan untuk menyesuaikan perilaku model agar sesuai dengan kebijakan, sehingga meningkatkan akurasi dan keandalan respons model
  • GPT-4o mini memiliki fitur mitigasi keamanan bawaan yang sama dengan GPT-4o
  • Lebih dari 70 pakar eksternal menguji GPT-4o untuk mengidentifikasi potensi risiko, dan OpenAI telah menanganinya serta akan membagikan detailnya dalam GPT-4o system card dan preparedness scorecard
  • GPT-4o mini adalah model pertama di API yang menerapkan metode instruction hierarchy untuk meningkatkan ketahanan model terhadap jailbreak, prompt injection, dan ekstraksi system prompt

Harga dan ketersediaan

  • GPT-4o mini kini tersedia sebagai model teks dan visi di Assistants API, Chat Completions API, dan Batch API
  • Developer membayar 15 sen per 1 juta token input dan 60 sen per 1 juta token output
  • Fine-tuning untuk GPT-4o mini dijadwalkan rilis dalam beberapa hari ke depan
  • Pengguna ChatGPT gratis, Plus, dan Team dapat mengakses GPT-4o mini mulai hari ini sebagai pengganti GPT-3.5
  • Pengguna Enterprise juga akan dapat mengaksesnya mulai minggu depan

Rencana ke depan

  • Seiring kemajuan luar biasa dalam kecerdasan AI, terjadi pula pengurangan biaya yang signifikan
  • Biaya per token GPT-4o mini 99% lebih rendah dibandingkan text-davinci-003 yang diperkenalkan pada 2022
  • OpenAI membayangkan masa depan di mana model terintegrasi mulus ke semua aplikasi dan situs web
  • GPT-4o mini membuka jalan bagi developer untuk membangun dan menskalakan aplikasi AI yang kuat dengan lebih efisien dan lebih murah
  • Masa depan AI menjadi semakin mudah diakses, andal, dan tertanam dalam pengalaman digital sehari-hari kita

1 komentar

 
wedding 2024-07-22

Sepertinya nanti juga akan keluar gpt-4o pro max ultra.