OpenAI merilis pratinjau model o1 yang berpikir lebih lama sebelum menjawab

xguru · 2024-09-13T08:50:46+09:00

Model penalaran baru untuk menyelesaikan masalah yang kompleks Model dilatih agar berpikir lebih lama tentang masalah sebelum memberikan respons Melalui pelatihan, model belajar meningkatkan proses berpikirnya, mencoba berbagai strategi, dan mengenali kesalahan Menunjukkan kinerja setara mahasiswa doktoral pada benchmark menantang di bidang fisika, kimia, dan biologi Juga menunjukkan hasil yang sangat baik dalam matematika dan coding Pada ujian seleksi International Mathematical Olympiad (IMO), GPT-4o hanya menjawab benar 13%, sementara model penalaran menjawab benar 83% Dalam kompetisi Codeforces, kemampuan coding mencapai persentil ke-89 Keamanan Merancang pendekatan pelatihan keamanan baru agar model mematuhi panduan keselamatan dan alignment Pada salah satu uji jailbreak tersulit, GPT-4o mendapat skor 22 dari 100, sedangkan model o1-preview mendapat 84 Memperkuat operasi keamanan, tata kelola internal, dan kerja sama dengan pemerintah federal Pengujian dan evaluasi ketat menggunakan Preparedness Framework Operasi red team tingkat tertinggi Proses peninjauan setingkat dewan, termasuk Safety & Security Committee Menandatangani perjanjian dengan lembaga riset keamanan AI di AS dan Inggris dan mulai menjalankannya Model ini untuk siapa Sangat berguna terutama saat menangani masalah kompleks di bidang seperti sains, coding, dan matematika Contohnya Peneliti layanan kesehatan dapat memberi anotasi pada data cell sequencing, Fisikawan dapat menghasilkan rumus matematika kompleks yang diperlukan untuk quantum optics, Pengembang dapat menggunakannya untuk membangun dan menjalankan workflow multilangkah OpenAI o1-mini Seri o1 sangat unggul dalam menghasilkan dan melakukan debug kode kompleks secara akurat Untuk memberikan solusi yang lebih efisien bagi developer, OpenAI juga merilis model penalaran yang lebih cepat dan lebih murah bernama o1-mini o1-mini 80% lebih murah daripada o1-preview Model yang kuat dan hemat biaya untuk aplikasi yang membutuhkan penalaran tetapi tidak membutuhkan pengetahuan dunia yang luas Cara menggunakan OpenAI o1 Pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT mulai hari ini Baik o1-preview maupun o1-mini dapat dipilih secara manual Saat peluncuran, o1-preview memiliki batas 30 pesan per minggu dan o1-mini memiliki batas 50 pesan per minggu Pengguna ChatGPT Enterprise dan Edu dapat mengakses kedua model mulai minggu depan Developer pada API usage tier 5 dapat mulai membuat prototipe dengan kedua model di API mulai hari ini, dengan batas kecepatan 20 RPM API untuk model-model ini saat ini belum mencakup fitur seperti function calling, streaming, dan dukungan system message Ada rencana untuk menyediakan akses o1-mini bagi semua pengguna ChatGPT Free Rencana ke depan Ini adalah pratinjau awal model penalaran untuk ChatGPT dan API Selain pembaruan model, ada rencana menambahkan fitur seperti browsing serta unggah file dan gambar agar lebih berguna bagi semua orang Bersamaan dengan seri OpenAI o1 yang baru, OpenAI berencana terus mengembangkan dan merilis model seri GPT

(openai.com)

8 poin oleh xguru 2024-09-13 | 4 komentar | Bagikan ke WhatsApp

Model penalaran baru untuk menyelesaikan masalah yang kompleks
Model dilatih agar berpikir lebih lama tentang masalah sebelum memberikan respons
Melalui pelatihan, model belajar meningkatkan proses berpikirnya, mencoba berbagai strategi, dan mengenali kesalahan
Menunjukkan kinerja setara mahasiswa doktoral pada benchmark menantang di bidang fisika, kimia, dan biologi
Juga menunjukkan hasil yang sangat baik dalam matematika dan coding
- Pada ujian seleksi International Mathematical Olympiad (IMO), GPT-4o hanya menjawab benar 13%, sementara model penalaran menjawab benar 83%
- Dalam kompetisi Codeforces, kemampuan coding mencapai persentil ke-89

Keamanan

Merancang pendekatan pelatihan keamanan baru agar model mematuhi panduan keselamatan dan alignment
Pada salah satu uji jailbreak tersulit, GPT-4o mendapat skor 22 dari 100, sedangkan model o1-preview mendapat 84
Memperkuat operasi keamanan, tata kelola internal, dan kerja sama dengan pemerintah federal
- Pengujian dan evaluasi ketat menggunakan Preparedness Framework
- Operasi red team tingkat tertinggi
- Proses peninjauan setingkat dewan, termasuk Safety & Security Committee
Menandatangani perjanjian dengan lembaga riset keamanan AI di AS dan Inggris dan mulai menjalankannya

Model ini untuk siapa

Sangat berguna terutama saat menangani masalah kompleks di bidang seperti sains, coding, dan matematika
Contohnya
- Peneliti layanan kesehatan dapat memberi anotasi pada data cell sequencing,
- Fisikawan dapat menghasilkan rumus matematika kompleks yang diperlukan untuk quantum optics,
- Pengembang dapat menggunakannya untuk membangun dan menjalankan workflow multilangkah

OpenAI o1-mini

Seri o1 sangat unggul dalam menghasilkan dan melakukan debug kode kompleks secara akurat
Untuk memberikan solusi yang lebih efisien bagi developer, OpenAI juga merilis model penalaran yang lebih cepat dan lebih murah bernama o1-mini
o1-mini 80% lebih murah daripada o1-preview
- Model yang kuat dan hemat biaya untuk aplikasi yang membutuhkan penalaran tetapi tidak membutuhkan pengetahuan dunia yang luas

Cara menggunakan OpenAI o1

Pengguna ChatGPT Plus dan Team dapat mengakses model o1 di ChatGPT mulai hari ini
Baik o1-preview maupun o1-mini dapat dipilih secara manual
Saat peluncuran, o1-preview memiliki batas 30 pesan per minggu dan o1-mini memiliki batas 50 pesan per minggu
Pengguna ChatGPT Enterprise dan Edu dapat mengakses kedua model mulai minggu depan
Developer pada API usage tier 5 dapat mulai membuat prototipe dengan kedua model di API mulai hari ini, dengan batas kecepatan 20 RPM
API untuk model-model ini saat ini belum mencakup fitur seperti function calling, streaming, dan dukungan system message
Ada rencana untuk menyediakan akses o1-mini bagi semua pengguna ChatGPT Free

Rencana ke depan

Ini adalah pratinjau awal model penalaran untuk ChatGPT dan API
Selain pembaruan model, ada rencana menambahkan fitur seperti browsing serta unggah file dan gambar agar lebih berguna bagi semua orang
Bersamaan dengan seri OpenAI o1 yang baru, OpenAI berencana terus mengembangkan dan merilis model seri GPT

4 komentar

dbs0829 2024-09-13

Saya penasaran dengan sinerginya dengan GitHub Copilot.

wedding 2024-09-13

Apakah ini Strawberry yang selama ini dirumorkan?

brainer 2024-09-13

Benar. Altman menghibur orang yang menyebarkan rumor itu.

xguru 2024-09-13

Sepertinya benar. Sepertinya mereka memilih nomor versi baru 1 hanya untuk fokus pada penalaran.