Postmortem gangguan Claude Code dari Anthropic: 23 April 2026
(anthropic.com)Selama sebulan terakhir, sejumlah pengguna terus melaporkan bahwa kualitas respons Claude menurun. Setelah menelusurinya, Anthropic mengonfirmasi bahwa penyebabnya adalah tiga perubahan berbeda yang memengaruhi Claude Code, Claude Agent SDK, dan Claude Cowork. API itu sendiri tidak terdampak, dan perusahaan menyatakan bahwa seluruh masalah telah diselesaikan per 20 April 2026 (v2.1.116). Postmortem ini menjelaskan penyebab masalah, perbaikan yang dilakukan, serta langkah pencegahan agar tidak terulang.
Tiga penyebab gangguan dan kronologinya
- Penurunan nilai bawaan upaya penalaran (reasoning effort) (4 Maret): Nilai bawaan tingkat upaya penalaran di Claude Code diubah dari
highmenjadimedium. Langkah ini dimaksudkan untuk mengurangi waktu tunggu yang panjang hingga UI terlihat seperti macet, tetapi pengguna merasakan penurunan kualitas respons, sehingga akhirnya dikembalikan seperti semula pada 7 April. Saat ini, nilai bawaannya ditetapkan kexhighuntuk Opus 4.7 danhighuntuk model lainnya. - Penghapusan riwayat penalaran akibat bug optimasi caching (26 Maret): Saat melanjutkan sesi yang tidak aktif lebih dari 1 jam, sebuah fitur yang dirancang untuk membersihkan riwayat penalaran (thinking) sebelumnya hanya satu kali, akibat bug justru terus menghapusnya berulang pada setiap giliran percakapan berikutnya. Akibatnya, Claude tidak dapat mengingat mengapa ia melakukan tugas tertentu, yang menjadi penyebab "pelupa", respons berulang, dan pemilihan alat yang tidak normal yang dialami pengguna. Cache miss (kondisi ketika data tersimpan tidak ditemukan) juga terus terjadi, sehingga batas penggunaan habis lebih cepat dari perkiraan. Ini diperbaiki pada 10 April.
- Instruksi penyederhanaan berlebihan dalam system prompt (16 April): Untuk mengurangi keluaran Opus 4.7 yang terlalu panjang, Anthropic menambahkan system prompt berbunyi "teks di antara pemanggilan alat maksimal 25 kata, respons akhir maksimal 100 kata". Tidak ada masalah dalam pengujian internal, tetapi kemudian dipastikan berdampak negatif pada kualitas coding di penggunaan nyata, sehingga dihapus pada 20 April.
Mengapa penemuan masalah terlambat
- Ketiga perubahan diterapkan pada waktu dan cakupan trafik yang berbeda-beda, sehingga tampak seperti penurunan kualitas umum yang tidak konsisten, dan sulit menunjuk penyebab masing-masing.
- Ada perbedaan antara lingkungan pengujian internal dan lingkungan pengguna nyata. Untuk bug caching, reproduksinya sendiri tidak mudah karena adanya eksperimen terpisah yang sedang berlangsung di internal dan perbedaan cara tampilan UI.
- Kerangka evaluasi (eval suite) yang ada belum cukup luas. Dampak perubahan system prompt baru menunjukkan penurunan performa 3% setelah evaluasi yang lebih beragam dijalankan.
Langkah pencegahan agar tidak terulang
- Mewajibkan karyawan internal menggunakan build publik yang sebenarnya, untuk mengurangi kesenjangan dengan build pengujian internal.
- Memperketat kontrol atas perubahan system prompt. Setiap perubahan akan melalui evaluasi luas per model, analisis dampak tiap baris secara individual (ablation), serta penerapan bertahap dan masa verifikasi yang cukup (soak period).
- Meningkatkan alat Code Review. Berangkat dari fakta bahwa bug caching dapat ditemukan ketika Opus 4.7 benar-benar diberi seluruh repositori kode terkait sebagai konteks, cakupan repositori yang bisa dirujuk saat code review akan diperluas.
- Membuka kanal komunikasi pengguna (@ClaudeDevs), untuk membagikan latar belakang keputusan produk secara transparan.
Tentang pernyataan "tidak ada penurunan kualitas yang disengaja"
- Anthropic menyatakan bahwa mereka tidak pernah sengaja menurunkan kualitas model, dan menegaskan bahwa API serta inference layer tidak terdampak. Namun, benar bahwa perubahan konfigurasi dan bug pada lapisan produk (Claude Code) bekerja secara gabungan hingga menurunkan kualitas yang dirasakan pengguna. Mereka juga mengumumkan langkah untuk mereset batas penggunaan bagi semua pelanggan berlangganan.
13 komentar
Bagaimana mungkin ketiga penyebab gangguan itu semuanya berhubungan langsung dengan penghematan biaya wkwkwk
Kelihatannya mereka benar-benar sedang sangat kekurangan resource GPU sampai performanya turun separah ini.....
Ini memang jawaban yang benar, tapi alasannya panjang banget wkwk
Mereka menulis panjang lebar bahwa selama ini mereka menerapkan build publik tanpa mengujinya, dan bahkan setelah dirilis pun tidak dites. Saya sendiri langsung terkena bug itu pada 26 Maret, jadi apakah masuk akal kalau di internal mereka butuh 3 minggu hanya untuk mengonfirmasinya...
Begitu patch diterapkan, kuota 5 jam yang biasanya baru habis setelah dipakai 3–4 jam mulai terkuras dalam 30 menit, tapi karena akun karyawan tidak punya kuota 5 jam atau setidaknya tidak sampai harus terus memantau
/usagesetiap saat saat bekerja, jadi wajar kalau butuh waktu lama untuk menyadarinya.Di benchmark harian SWE-Bench-Pro (set terkurasi), ada hal menarik kalau melihat claude code.
Di rentang 4/10~4/20, runtime turun setengah (653d→345d), tool call turun setengah (3.3K→1.8K), token turun −18%, tetapi pass rate justru naik +16pp. Keempat metrik bergerak ke arah yang baik secara bersamaan bukan pola yang umum.
Tiga insiden yang terjadi dalam proses itu adalah postmortem 4/23, dan kalau dilihat semuanya terjadi karena "saat mencoba mengurangi token/latency".
Sebaliknya, codex (gpt-5.4-xhigh) hampir tidak berubah angkanya pada periode yang sama. Pass rate tetap di sekitar 56%, dan token/runtime/tool call juga tetap di level sekitar dua kali claude code.
Apakah ini bukan postmortem insiden, melainkan postmortem penghematan biaya?
Mereka mewajibkan karyawan internal untuk menggunakan build publik yang sebenarnya, sehingga mengurangi kesenjangan dengan build untuk pengujian internal.
wkwkwk
Sepertinya mereka mengajari Opus 4.7 soal YAGNI. Setiap kali ada keputusan arsitektur, saya kira memang begitu karena selalu diberi alasan “perbaikan bertahap sesuai YAGNI”, tapi ujung-ujungnya malah bikin insiden. Teman yang daya ingatnya juga tidak panjang ini sampai punya kebiasaan menunda-nunda, jadi gawat.
Apakah hanya saya yang berpikir bahwa awalnya mereka ngotot bilang tidak ada masalah, lalu karena isu ini membesar terlalu jauh untuk ditutup-tutupi, akhirnya mereka memutuskan untuk mengungkapkannya?
claude.ai web juga terasa mengalami penurunan kegunaan kecil-kecilan... Saya bahkan mematikan memori demi menghemat token.
Entah kenapa, setelah melihat pengumuman ini saya malah jadi makin tidak bisa mempercayai Anthropic.
Ada 2 tulisan terkait di atas, dan jarak antara keduanya 7 bulan. Masalahnya pun sama-sama ada 3.
Analisis pascakejadian atas tiga isu penurunan kualitas Claude terbaru 2025-09-19
Pembaruan tentang laporan kualitas Claude Code terbaru 2026-04-24
Saya marah sebesar kredit $5!!
Panjang juga omongannya..