Anthropic merilis Claude 4

(anthropic.com)

19 poin oleh humblebee 2025-05-23 | 2 komentar | Bagikan ke WhatsApp

Anthropic merilis seri Claude 4 pada 23 Mei 2025. Claude Opus 4 dan Claude Sonnet 4 yang diumumkan kali ini adalah model yang meningkatkan kemampuan coding dan pelaksanaan pekerjaan jangka panjang dibanding versi sebelumnya, dengan harga yang tetap sama seperti sebelumnya.

Kemampuan kerja berkelanjutan
- Bekerja terus-menerus selama 7 jam: Dalam refaktorisasi open source yang diverifikasi Rakuten, model ini bekerja secara mandiri selama 7 jam
- Menangani tugas kompleks yang mencakup ribuan langkah tanpa terhenti
- Daya tahan kerja yang jauh melampaui batas AI agent sebelumnya
Sistem memori yang ditingkatkan
- Secara otomatis membuat file memori seperti 'Navigation Guide' untuk meningkatkan pemahaman konteks pekerjaan jangka panjang
- Pemanfaatan memori yang praktis, seperti menulis sendiri panduan navigasi saat memainkan game Pokémon
- Perilaku penggunaan jalan pintas/celah berkurang 65% dibanding model sebelumnya
Model penalaran hibrida
- Mode respons instan: untuk situasi yang memerlukan jawaban cepat
- Mode pemikiran diperluas: memungkinkan penalaran mendalam hingga 64K token
- Secara otomatis beralih antara dua mode sesuai situasi
Penggunaan alat
- Eksekusi alat paralel: menggunakan beberapa alat sekaligus untuk meningkatkan efisiensi
- Penggunaan alat saat berpikir: memanfaatkan pencarian web dan lainnya selama proses penalaran untuk menghasilkan jawaban yang lebih akurat
Peningkatan kualitas kode
- Evaluasi Block: "model pertama yang meningkatkan kualitas kode selama pengeditan dan debugging"
- Laporan iGent: tingkat kesalahan penelusuran codebase turun dari 20% menjadi hampir 0%
- Sourcegraph: kualitas kode yang lebih elegan dan pemahaman masalah yang lebih mendalam
Integrasi praktis Claude Code
- Integrasi langsung dengan IDE: perubahan kode langsung ditampilkan di editor
- Penanganan GitHub PR: memproses otomatis umpan balik reviewer PR dan memperbaiki error CI
- Pekerjaan latar belakang: mendukung otomatisasi melalui GitHub Actions
- SDK yang dapat diperluas: developer dapat membangun agent mereka sendiri
Fitur baru API
- Alat eksekusi kode
- Konektor MCP
- Files API
- Prompt caching hingga 1 jam
Keamanan
- Menerapkan langkah perlindungan ASL-3 (AI Safety Level 3)
- Kemampuan kepatuhan terhadap instruksi yang lebih canggih
- Perilaku yang lebih bertanggung jawab dengan kemungkinan penyalahgunaan yang lebih rendah

2 komentar

humblebee 2025-05-23

Disebutkan bahwa refactoring dilakukan tanpa henti selama 7 jam; jika kualitasnya memang bagus, mungkin kita juga bisa berharap level pekerjaan outsourcing tingkat lanjut yang diserahkan pengembang setelah pulang kerja lalu ditinjau keesokan harinya 😂

sinbumu 2025-05-23

Bagian ini memang sedang ditangkap, jadi di tempat seperti Google mereka juga sedang uji beta agen coding seperti Jules secara percobaan... kalau pekerjaan dilempar ke AI, nanti dia akan mengerjakannya sendiri di lingkungan cloud, bukan di mesin lokal, lalu belakangan tinggal cek hasilnya dan suruh commit, deploy, dan sebagainya

Anthropic merilis Claude 4

Bacaan terkait

2 komentar