8 poin oleh xguru 2024-09-13 | 4 komentar | Bagikan ke WhatsApp
  • Model penalaran baru untuk menyelesaikan masalah yang kompleks
  • Model dilatih agar berpikir lebih lama tentang masalah sebelum memberikan respons
  • Melalui pelatihan, model belajar meningkatkan proses berpikirnya, mencoba berbagai strategi, dan mengenali kesalahan
  • Menunjukkan kinerja setara mahasiswa doktoral pada benchmark menantang di bidang fisika, kimia, dan biologi
  • Juga menunjukkan hasil yang sangat baik dalam matematika dan coding
    • Pada ujian seleksi International Mathematical Olympiad (IMO), GPT-4o hanya menjawab benar 13%, sementara model penalaran menjawab benar 83%
    • Dalam kompetisi Codeforces, kemampuan coding mencapai persentil ke-89

Keamanan

  • Merancang pendekatan pelatihan keamanan baru agar model mematuhi panduan keselamatan dan alignment
  • Pada salah satu uji jailbreak tersulit, GPT-4o mendapat skor 22 dari 100, sedangkan model o1-preview mendapat 84
  • Memperkuat operasi keamanan, tata kelola internal, dan kerja sama dengan pemerintah federal
    • Pengujian dan evaluasi ketat menggunakan Preparedness Framework
    • Operasi red team tingkat tertinggi
    • Proses peninjauan setingkat dewan, termasuk Safety & Security Committee
  • Menandatangani perjanjian dengan lembaga riset keamanan AI di AS dan Inggris dan mulai menjalankannya

Model ini untuk siapa

  • Sangat berguna terutama saat menangani masalah kompleks di bidang seperti sains, coding, dan matematika
  • Contohnya
    • Peneliti layanan kesehatan dapat memberi anotasi pada data cell sequencing,
    • Fisikawan dapat menghasilkan rumus matematika kompleks yang diperlukan untuk quantum optics,
    • Pengembang dapat menggunakannya untuk membangun dan menjalankan workflow multilangkah

OpenAI o1-mini

  • Seri o1 sangat unggul dalam menghasilkan dan melakukan debug kode kompleks secara akurat
  • Untuk memberikan solusi yang lebih efisien bagi developer, OpenAI juga merilis model penalaran yang lebih cepat dan lebih murah bernama o1-mini
  • o1-mini 80% lebih murah daripada o1-preview
    • Model yang kuat dan hemat biaya untuk aplikasi yang membutuhkan penalaran tetapi tidak membutuhkan pengetahuan dunia yang luas

Cara menggunakan OpenAI o1

  • Pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT mulai hari ini
  • Baik o1-preview maupun o1-mini dapat dipilih secara manual
  • Saat peluncuran, o1-preview memiliki batas 30 pesan per minggu dan o1-mini memiliki batas 50 pesan per minggu
  • Pengguna ChatGPT Enterprise dan Edu dapat mengakses kedua model mulai minggu depan
  • Developer pada API usage tier 5 dapat mulai membuat prototipe dengan kedua model di API mulai hari ini, dengan batas kecepatan 20 RPM
  • API untuk model-model ini saat ini belum mencakup fitur seperti function calling, streaming, dan dukungan system message
  • Ada rencana untuk menyediakan akses o1-mini bagi semua pengguna ChatGPT Free

Rencana ke depan

  • Ini adalah pratinjau awal model penalaran untuk ChatGPT dan API
  • Selain pembaruan model, ada rencana menambahkan fitur seperti browsing serta unggah file dan gambar agar lebih berguna bagi semua orang
  • Bersamaan dengan seri OpenAI o1 yang baru, OpenAI berencana terus mengembangkan dan merilis model seri GPT

4 komentar

 
dbs0829 2024-09-13

Saya penasaran dengan sinerginya dengan GitHub Copilot.

 
wedding 2024-09-13

Apakah ini Strawberry yang selama ini dirumorkan?

 
brainer 2024-09-13

Benar. Altman menghibur orang yang menyebarkan rumor itu.

 
xguru 2024-09-13

Sepertinya benar. Sepertinya mereka memilih nomor versi baru 1 hanya untuk fokus pada penalaran.