Anthropic merilis Claude Opus 4.8
(anthropic.com)Anthropic telah merilis Claude Opus 4.8, versi peningkatan dari model unggulan mereka, Claude Opus. Berdasarkan versi sebelumnya, 4.7, model ini meningkatkan performa benchmark dan memperkuat kemampuan kolaborasi, sementara harganya tetap sama.
Peningkatan utama dan fitur
- Peningkatan performa: Menunjukkan performa yang lebih unggul dibanding model sebelumnya maupun model pesaing seperti GPT-5.5 dalam coding, keterampilan agen, penalaran, dan tugas pengetahuan praktis secara menyeluruh.
- Peningkatan kejujuran (Honesty): Memperbaiki masalah AI yang membuat klaim tanpa dasar atau terlalu cepat menarik kesimpulan. Opus 4.8 menandai sendiri bagian yang tidak pasti, dan kemungkinan melewatkan cacat dalam kode menjadi sekitar 4 kali lebih rendah dibanding model sebelumnya.
- Kemampuan agen yang andal: Hasil uji awal menunjukkan bahwa saat menjalankan tugas kompleks multi-langkah, penilaiannya menjadi lebih tajam, serta menunjukkan kemampuan kolaborasi yang lebih baik seperti menangkap kesalahannya sendiri dan mengajukan keberatan ketika rencananya tidak valid.
- Efisiensi biaya: Kecepatan 'Fast Mode' meningkat 2,5 kali, dan biayanya menjadi 3 kali lebih murah dibanding model sebelumnya.
Fitur baru yang dirilis bersama
- Dynamic Workflows: Fitur research preview di Claude Code yang dapat menjalankan ratusan sub-agent paralel untuk menangani tugas kompleks seperti migrasi codebase skala besar.
- Effort Control: Pengguna dapat memilih tingkat upaya yang akan dicurahkan Claude untuk suatu tugas. Pada pengaturan tinggi, Claude berpikir lebih dalam untuk memberikan respons berkualitas tinggi, sedangkan pada pengaturan rendah, Claude merespons lebih cepat.
- Pembaruan Messages API: Kini entri sistem dapat dimasukkan ke dalam array pesan, sehingga instruksi dapat diperbarui di tengah pekerjaan tanpa merusak prompt cache.
Rencana ke depan
Anthropic sedang mengembangkan model yang memberikan performa kelas Opus dengan biaya lebih rendah, dan melalui Project Glasswing mereka menyiapkan kelas model baru dengan kecerdasan yang lebih tinggi daripada Opus (Claude Mythos). Saat ini model tersebut sedang menjalani pengujian keamanan di beberapa organisasi, dan dijadwalkan tersedia untuk semua pelanggan dalam beberapa minggu ke depan.
Harga dan panduan penggunaan
- Mode umum: input $5 / 1M token, output $25 / 1M token (sama seperti Opus 4.7)
- Fast Mode: input $10 / 1M token, output $50 / 1M token
- Nama model:
claude-opus-4-8
Belum ada komentar.