Anthropic merilis Claude 4
(anthropic.com)Anthropic merilis seri Claude 4 pada 23 Mei 2025. Claude Opus 4 dan Claude Sonnet 4 yang diumumkan kali ini adalah model yang meningkatkan kemampuan coding dan pelaksanaan pekerjaan jangka panjang dibanding versi sebelumnya, dengan harga yang tetap sama seperti sebelumnya.
-
Kemampuan kerja berkelanjutan
- Bekerja terus-menerus selama 7 jam: Dalam refaktorisasi open source yang diverifikasi Rakuten, model ini bekerja secara mandiri selama 7 jam
- Menangani tugas kompleks yang mencakup ribuan langkah tanpa terhenti
- Daya tahan kerja yang jauh melampaui batas AI agent sebelumnya
-
Sistem memori yang ditingkatkan
- Secara otomatis membuat file memori seperti 'Navigation Guide' untuk meningkatkan pemahaman konteks pekerjaan jangka panjang
- Pemanfaatan memori yang praktis, seperti menulis sendiri panduan navigasi saat memainkan game Pok茅mon
- Perilaku penggunaan jalan pintas/celah berkurang 65% dibanding model sebelumnya
-
Model penalaran hibrida
- Mode respons instan: untuk situasi yang memerlukan jawaban cepat
- Mode pemikiran diperluas: memungkinkan penalaran mendalam hingga 64K token
- Secara otomatis beralih antara dua mode sesuai situasi
-
Penggunaan alat
- Eksekusi alat paralel: menggunakan beberapa alat sekaligus untuk meningkatkan efisiensi
- Penggunaan alat saat berpikir: memanfaatkan pencarian web dan lainnya selama proses penalaran untuk menghasilkan jawaban yang lebih akurat
-
Peningkatan kualitas kode
- Evaluasi Block: "model pertama yang meningkatkan kualitas kode selama pengeditan dan debugging"
- Laporan iGent: tingkat kesalahan penelusuran codebase turun dari 20% menjadi hampir 0%
- Sourcegraph: kualitas kode yang lebih elegan dan pemahaman masalah yang lebih mendalam
-
Integrasi praktis Claude Code
- Integrasi langsung dengan IDE: perubahan kode langsung ditampilkan di editor
- Penanganan GitHub PR: memproses otomatis umpan balik reviewer PR dan memperbaiki error CI
- Pekerjaan latar belakang: mendukung otomatisasi melalui GitHub Actions
- SDK yang dapat diperluas: developer dapat membangun agent mereka sendiri
-
Fitur baru API
- Alat eksekusi kode
- Konektor MCP
- Files API
- Prompt caching hingga 1 jam
-
Keamanan
- Menerapkan langkah perlindungan ASL-3 (AI Safety Level 3)
- Kemampuan kepatuhan terhadap instruksi yang lebih canggih
- Perilaku yang lebih bertanggung jawab dengan kemungkinan penyalahgunaan yang lebih rendah
2 komentar
Disebutkan bahwa refactoring dilakukan tanpa henti selama 7 jam; jika kualitasnya memang bagus, mungkin kita juga bisa berharap level pekerjaan outsourcing tingkat lanjut yang diserahkan pengembang setelah pulang kerja lalu ditinjau keesokan harinya 馃槀
Bagian ini memang sedang ditangkap, jadi di tempat seperti Google mereka juga sedang uji beta agen coding seperti Jules secara percobaan... kalau pekerjaan dilempar ke AI, nanti dia akan mengerjakannya sendiri di lingkungan cloud, bukan di mesin lokal, lalu belakangan tinggal cek hasilnya dan suruh commit, deploy, dan sebagainya