- Model penalaran baru untuk menyelesaikan masalah yang kompleks
- Model dilatih agar berpikir lebih lama tentang masalah sebelum memberikan respons
- Melalui pelatihan, model belajar meningkatkan proses berpikirnya, mencoba berbagai strategi, dan mengenali kesalahan
- Menunjukkan kinerja setara mahasiswa doktoral pada benchmark menantang di bidang fisika, kimia, dan biologi
- Juga menunjukkan hasil yang sangat baik dalam matematika dan coding
- Pada ujian seleksi International Mathematical Olympiad (IMO), GPT-4o hanya menjawab benar 13%, sementara model penalaran menjawab benar 83%
- Dalam kompetisi Codeforces, kemampuan coding mencapai persentil ke-89
Keamanan
- Merancang pendekatan pelatihan keamanan baru agar model mematuhi panduan keselamatan dan alignment
- Pada salah satu uji jailbreak tersulit, GPT-4o mendapat skor 22 dari 100, sedangkan model o1-preview mendapat 84
- Memperkuat operasi keamanan, tata kelola internal, dan kerja sama dengan pemerintah federal
- Pengujian dan evaluasi ketat menggunakan Preparedness Framework
- Operasi red team tingkat tertinggi
- Proses peninjauan setingkat dewan, termasuk Safety & Security Committee
- Menandatangani perjanjian dengan lembaga riset keamanan AI di AS dan Inggris dan mulai menjalankannya
Model ini untuk siapa
- Sangat berguna terutama saat menangani masalah kompleks di bidang seperti sains, coding, dan matematika
- Contohnya
- Peneliti layanan kesehatan dapat memberi anotasi pada data cell sequencing,
- Fisikawan dapat menghasilkan rumus matematika kompleks yang diperlukan untuk quantum optics,
- Pengembang dapat menggunakannya untuk membangun dan menjalankan workflow multilangkah
OpenAI o1-mini
- Seri o1 sangat unggul dalam menghasilkan dan melakukan debug kode kompleks secara akurat
- Untuk memberikan solusi yang lebih efisien bagi developer, OpenAI juga merilis model penalaran yang lebih cepat dan lebih murah bernama o1-mini
- o1-mini 80% lebih murah daripada o1-preview
- Model yang kuat dan hemat biaya untuk aplikasi yang membutuhkan penalaran tetapi tidak membutuhkan pengetahuan dunia yang luas
Cara menggunakan OpenAI o1
- Pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT mulai hari ini
- Baik o1-preview maupun o1-mini dapat dipilih secara manual
- Saat peluncuran, o1-preview memiliki batas 30 pesan per minggu dan o1-mini memiliki batas 50 pesan per minggu
- Pengguna ChatGPT Enterprise dan Edu dapat mengakses kedua model mulai minggu depan
- Developer pada API usage tier 5 dapat mulai membuat prototipe dengan kedua model di API mulai hari ini, dengan batas kecepatan 20 RPM
- API untuk model-model ini saat ini belum mencakup fitur seperti function calling, streaming, dan dukungan system message
- Ada rencana untuk menyediakan akses o1-mini bagi semua pengguna ChatGPT Free
Rencana ke depan
- Ini adalah pratinjau awal model penalaran untuk ChatGPT dan API
- Selain pembaruan model, ada rencana menambahkan fitur seperti browsing serta unggah file dan gambar agar lebih berguna bagi semua orang
- Bersamaan dengan seri OpenAI o1 yang baru, OpenAI berencana terus mengembangkan dan merilis model seri GPT
4 komentar
Saya penasaran dengan sinerginya dengan GitHub Copilot.
Apakah ini Strawberry yang selama ini dirumorkan?
Benar. Altman menghibur orang yang menyebarkan rumor itu.
Sepertinya benar. Sepertinya mereka memilih nomor versi baru 1 hanya untuk fokus pada penalaran.