- Setelah serangkaian gangguan layanan yang terkait dengan penggunaan alat coding AI, Amazon memperkenalkan prosedur persetujuan awal oleh insinyur senior untuk semua perubahan kode berbantuan AI
- Menurut catatan internal, penyebab gangguan disebut sebagai "pemanfaatan GenAI baru yang praktik terbaik dan pengamanannya belum sepenuhnya mapan"
- Bulan ini, situs web dan aplikasi belanja Amazon down selama sekitar 6 jam, sehingga pelanggan tidak bisa menyelesaikan transaksi, memeriksa informasi akun, atau melihat harga, dengan penyebab berupa penerapan kode perangkat lunak yang keliru
- Di AWS, asisten coding AI Kiro juga dilaporkan memicu gangguan 13 jam setelah menghapus dan membuat ulang environment, sehingga setidaknya ada dua insiden terkait AI yang tercatat
- Karena risiko operasional dari penerapan alat coding AI ke production kini menjadi nyata, diberlakukan langkah langsung yang mewajibkan perubahan berbantuan AI oleh insinyur junior dan level menengah ditandatangani insinyur senior
Rapat internal Amazon dan langkah penanganan
- Divisi e-commerce Amazon mengadakan rapat rekayasa berskala besar untuk menganalisis gangguan layanan beruntun yang baru-baru ini terjadi
- Agenda rapat mencakup insiden yang terkait dengan penggunaan alat coding AI
- Dalam catatan briefing internal disebutkan bahwa insiden "berisiko tinggi (high blast radius)" meningkat dalam beberapa bulan terakhir, dan "perubahan berbantuan Gen-AI" disebut sebagai faktor utama
- Dokumen tersebut menyebut "kasus penggunaan GenAI baru yang belum sepenuhnya mapan" sebagai faktor yang berkontribusi
- Senior vice president Dave Treadwell menyebut dalam email bahwa ketersediaan situs dan infrastruktur belakangan ini kurang baik
Contoh gangguan terkait AI
- Situs web dan aplikasi belanja Amazon mengalami gangguan sekitar 6 jam pada awal bulan ini, dengan penyebab yang dipastikan sebagai "penerapan kode perangkat lunak yang keliru"
- Akibatnya, pelanggan tidak dapat menyelesaikan transaksi, memeriksa informasi akun, maupun melihat harga produk
- Di AWS juga terjadi masalah saat menggunakan asisten coding AI Kiro
- Pada pertengahan Desember, Kiro memutuskan untuk "menghapus lalu membuat ulang" environment, sehingga layanan kalkulator biaya berhenti selama 13 jam
- Amazon menjelaskan insiden ini sebagai "kejadian yang sangat terbatas dan hanya memengaruhi satu layanan di sebagian wilayah daratan Tiongkok"
- Untuk insiden kedua, pihak Amazon menambahkan bahwa "tidak ada dampak pada layanan AWS yang menghadap pelanggan"
Prosedur persetujuan baru dan perbaikan operasional
- Treadwell berencana membahas penyebab masalah dan langkah perbaikan jangka pendek melalui rapat mingguan
This Week in Stores Tech (TWiST)
- Rapat yang sebelumnya opsional dihadiri kini diubah menjadi dianjurkan untuk dihadiri seluruh karyawan
- Ke depan, perubahan kode berbantuan AI yang dilakukan insinyur junior dan level menengah harus mendapat persetujuan tanda tangan dari insinyur senior
- Amazon menyebut peninjauan ini sebagai "bagian dari proses bisnis normal" dan menargetkan perbaikan berkelanjutan
Kontroversi pengurangan tenaga kerja dan meningkatnya gangguan
- Financial Times melaporkan bahwa beberapa insinyur menyebut insiden level 'Sev2' (gangguan tingkat menengah yang memerlukan respons cepat) meningkat setelah pengurangan tenaga kerja
- Amazon telah beberapa kali melakukan restrukturisasi dalam beberapa tahun terakhir, dan memangkas 16.000 posisi korporat hanya pada Januari 2026
- Namun, perusahaan tidak setuju dengan klaim bahwa pengurangan tenaga kerja menjadi penyebab meningkatnya gangguan
Arah ke depan
- Amazon kini menjadikan peninjauan ketersediaan situs web dan evaluasi kinerja operasional sebagai kegiatan rutin
- Perusahaan juga mendorong secara paralel pemanfaatan aman alat coding AI dan penguatan sistem pencegahan gangguan
- Langkah ini dinilai sebagai contoh yang kembali menonjolkan pentingnya prosedur verifikasi manusia di tengah meluasnya adopsi AI
6 komentar
Tidak ada jaminan bahwa kode AI akan aman hanya karena direview oleh engineer senior
insiden CrowdStrike juga bukan karena AI
dan Heartbleed pun merupakan insiden dari era sebelum ada AI
Pada akhirnya, intinya adalah mereka ingin membebankan tanggung jawab kepada seseorang
Ini mengingatkan saya pada dark humor para akuntan pajak yang bilang bahwa kita tidak akan tergantikan karena secara hukum harus ada manusia yang bertanggung jawab
Betul, jadi sepertinya ini akan terus berlanjut kecuali semacam tanda tangan hukum ditambahkan ke agen AI..
Kalau begitu, biaya penggunaan Anthropic atau OpenAI harus jadi sangat mahal.
Setiap kali memanggil API, harus bayar premi asuransi.
Hmm.. ini cuma spekulasi, tapi saya merasa mungkin akan muncul sesuatu seperti IAM..
Katanya peran akuntan pajak itu masuk penjara, tapi perusahaan asuransi tidak akan menggantikan masuk penjara, jadi pada akhirnya...
Komentar Hacker News
“mandatory meeting” kali ini adalah rapat operasional seluruh perusahaan yang memang diadakan setiap minggu
Hanya saja tingkat kehadiran minggu ini tinggi karena ada insiden operasional besar minggu lalu
Rasanya media terlalu melebih-lebihkan
Selain itu juga disebut kebijakan bahwa “perubahan kode AI oleh engineer junior dan mid-level memerlukan persetujuan senior”
Meski itu rapat rutin, kalau ada pengumuman kebijakan baru saya rasa tetap layak diberitakan
Harga tidak tampil dan barang juga tidak bisa dimasukkan ke keranjang
Kalau ini terjadi pada pesaing seperti Walmart, seharusnya akan muncul di berita, jadi terasa aneh
Kebijakan “engineer junior dan mid-level tidak boleh mendorong kode AI tanpa persetujuan senior” tampaknya berangkat dari ilusi bahwa review senior itu solusi untuk segalanya
Kenyataannya, agar senior benar-benar memverifikasi kode secara penuh, waktu yang dibutuhkan hampir sama dengan menulisnya sendiri
Artinya, review memang bernilai, tetapi tidak mengubah kode buruk menjadi kode bagus
Pada akhirnya, masalahnya adalah saat membangun sistem yang “idiot proof”, muncul kesalahpahaman bahwa boleh merekrut ‘idiot’
Menemukan bug hanyalah efek samping, dan yang benar-benar penting adalah mempermudah pengujian serta mengurangi kompleksitas kode
Tetapi hal-hal seperti ini tidak membantu untuk promosi
Akan lebih efisien jika diawasi sejak model sedang mengerjakan tugas
Kalau tidak, AI akan memuntahkan bom kode berkualitas rendah
Kalau ahli mau menghabiskan waktu 5–15 kali lebih banyak untuk memperbaikinya mungkin masih aman, kalau tidak codebase akan rusak
Terutama kode yang buruk, waktu untuk memahaminya bisa berlipat ganda
Karena harus menyimpan kode lama dan solusi baru di kepala pada saat yang sama lalu membandingkannya, beban kognitifnya besar
Pada akhirnya ini tampak seperti evolusi alami perusahaan menuju fokus pada pengelolaan kinerja rata-rata
Di internal Amazon, kebanyakan orang hanya peduli pada tidak di-PHK dan naik jabatan
Evaluasi developer ditentukan oleh “kecepatan menyelesaikan tiket”, “jumlah komentar PR”, dan “penulisan dokumen”
Kalau tidak memakai AI, Anda tertinggal dalam persaingan
Dalam struktur seperti ini, permintaan untuk “menahan penggunaan AI” sulit berjalan secara realistis
Semakin baik kolaborasi sebuah tim, biasanya semakin sedikit diskusi di PR
Saya rasa yang benar-benar dibutuhkan adalah proses self-review
Mendorong langsung kode yang ditulis AI itu berbahaya
Platform seperti GitHub seharusnya menambahkan opsi “self-review wajib”, agar penulis secara eksplisit menyatakan bahwa ia sudah meninjaunya sendiri
Karena UI lokal lebih cepat, saya jadi lebih mudah memahami alur proyek secara keseluruhan
Kelihatannya seperti hal yang sudah jelas, tetapi dalam praktiknya tetap membantu
Kepercayaan pada kepemimpinan Amazon sedang menurun
Dengan keluarnya para veteran, penurunan kualitas AI, dan gangguan yang sering terjadi, terasa seolah engineering-nya sedang runtuh
Para pengambil keputusan tampaknya tidak memahami bottleneck pipeline
Walaupun AI bisa membuat diff 10 kali lebih cepat, kalau review tetap menjadi bottleneck maka kecepatan total tidak berubah
Akibatnya justru biaya dan ketidakpastian bertambah
Jika review kode AI dilakukan pada tahap PR, maka keuntungan produktivitasnya hilang
AI bisa membuat fitur dalam 10 menit, tetapi review manusia memakan waktu 10–20 kali lebih lama
Yang benar-benar sulit adalah mengetahui “apa yang dibuat dan mengapa” serta “apakah dibuat dengan benar”
AI masih belum bisa melakukan dua hal itu
Sampai LLM bisa sama-sama bagus dalam produksi dan review, yang bertambah hanya risiko
Ini kebijakan yang secara realistis mustahil
Saat itu, katanya, akan datang era deploy langsung setelah pengujian
Hakikat code review bukan deteksi error, melainkan sinkronisasi tim dan pembelajaran
Melalui review, desain dan standar dibagikan, engineer junior dibimbing, dan berbagai sudut pandang diakomodasi
Proses seperti inilah inti dari pengurangan error itu sendiri
Karena jika sudah bergerak ke arah desain yang salah, sangat sulit untuk menariknya kembali
Waktu dan biaya yang dicurahkan untuk demam AI terlalu besar
Saya khawatir bagaimana nasib software infrastruktur penting ke depannya
Jika software penerbangan pun terseret arus seperti ini, akibatnya bisa fatal
AI lebih mungkin dipakai sebagai alat bantu untuk meningkatkan kualitas