Setelah Gangguan Beruntun, Amazon Wajibkan Persetujuan Insinyur Senior untuk Perubahan Kode Berbantuan AI

(arstechnica.com)

21 poin oleh GN⁺ 2026-03-11 | 6 komentar | Bagikan ke WhatsApp

Setelah serangkaian gangguan layanan yang terkait dengan penggunaan alat coding AI, Amazon memperkenalkan prosedur persetujuan awal oleh insinyur senior untuk semua perubahan kode berbantuan AI
Menurut catatan internal, penyebab gangguan disebut sebagai "pemanfaatan GenAI baru yang praktik terbaik dan pengamanannya belum sepenuhnya mapan"
Bulan ini, situs web dan aplikasi belanja Amazon down selama sekitar 6 jam, sehingga pelanggan tidak bisa menyelesaikan transaksi, memeriksa informasi akun, atau melihat harga, dengan penyebab berupa penerapan kode perangkat lunak yang keliru
Di AWS, asisten coding AI Kiro juga dilaporkan memicu gangguan 13 jam setelah menghapus dan membuat ulang environment, sehingga setidaknya ada dua insiden terkait AI yang tercatat
Karena risiko operasional dari penerapan alat coding AI ke production kini menjadi nyata, diberlakukan langkah langsung yang mewajibkan perubahan berbantuan AI oleh insinyur junior dan level menengah ditandatangani insinyur senior

Rapat internal Amazon dan langkah penanganan

Divisi e-commerce Amazon mengadakan rapat rekayasa berskala besar untuk menganalisis gangguan layanan beruntun yang baru-baru ini terjadi
- Agenda rapat mencakup insiden yang terkait dengan penggunaan alat coding AI
- Dalam catatan briefing internal disebutkan bahwa insiden "berisiko tinggi (high blast radius)" meningkat dalam beberapa bulan terakhir, dan "perubahan berbantuan Gen-AI" disebut sebagai faktor utama
Dokumen tersebut menyebut "kasus penggunaan GenAI baru yang belum sepenuhnya mapan" sebagai faktor yang berkontribusi
Senior vice president Dave Treadwell menyebut dalam email bahwa ketersediaan situs dan infrastruktur belakangan ini kurang baik

Contoh gangguan terkait AI

Situs web dan aplikasi belanja Amazon mengalami gangguan sekitar 6 jam pada awal bulan ini, dengan penyebab yang dipastikan sebagai "penerapan kode perangkat lunak yang keliru"
- Akibatnya, pelanggan tidak dapat menyelesaikan transaksi, memeriksa informasi akun, maupun melihat harga produk
Di AWS juga terjadi masalah saat menggunakan asisten coding AI Kiro
- Pada pertengahan Desember, Kiro memutuskan untuk "menghapus lalu membuat ulang" environment, sehingga layanan kalkulator biaya berhenti selama 13 jam
- Amazon menjelaskan insiden ini sebagai "kejadian yang sangat terbatas dan hanya memengaruhi satu layanan di sebagian wilayah daratan Tiongkok"
- Untuk insiden kedua, pihak Amazon menambahkan bahwa "tidak ada dampak pada layanan AWS yang menghadap pelanggan"

Prosedur persetujuan baru dan perbaikan operasional

Treadwell berencana membahas penyebab masalah dan langkah perbaikan jangka pendek melalui rapat mingguan This Week in Stores Tech (TWiST)
- Rapat yang sebelumnya opsional dihadiri kini diubah menjadi dianjurkan untuk dihadiri seluruh karyawan
Ke depan, perubahan kode berbantuan AI yang dilakukan insinyur junior dan level menengah harus mendapat persetujuan tanda tangan dari insinyur senior
Amazon menyebut peninjauan ini sebagai "bagian dari proses bisnis normal" dan menargetkan perbaikan berkelanjutan

Kontroversi pengurangan tenaga kerja dan meningkatnya gangguan

Financial Times melaporkan bahwa beberapa insinyur menyebut insiden level 'Sev2' (gangguan tingkat menengah yang memerlukan respons cepat) meningkat setelah pengurangan tenaga kerja
Amazon telah beberapa kali melakukan restrukturisasi dalam beberapa tahun terakhir, dan memangkas 16.000 posisi korporat hanya pada Januari 2026
Namun, perusahaan tidak setuju dengan klaim bahwa pengurangan tenaga kerja menjadi penyebab meningkatnya gangguan

Arah ke depan

Amazon kini menjadikan peninjauan ketersediaan situs web dan evaluasi kinerja operasional sebagai kegiatan rutin
Perusahaan juga mendorong secara paralel pemanfaatan aman alat coding AI dan penguatan sistem pencegahan gangguan
Langkah ini dinilai sebagai contoh yang kembali menonjolkan pentingnya prosedur verifikasi manusia di tengah meluasnya adopsi AI

6 komentar

click 2026-03-11

Tidak ada jaminan bahwa kode AI akan aman hanya karena direview oleh engineer senior
insiden CrowdStrike juga bukan karena AI
dan Heartbleed pun merupakan insiden dari era sebelum ada AI

Pada akhirnya, intinya adalah mereka ingin membebankan tanggung jawab kepada seseorang
Ini mengingatkan saya pada dark humor para akuntan pajak yang bilang bahwa kita tidak akan tergantikan karena secara hukum harus ada manusia yang bertanggung jawab

sea715 2026-03-11

Betul, jadi sepertinya ini akan terus berlanjut kecuali semacam tanda tangan hukum ditambahkan ke agen AI..

click 2026-03-11

Kalau begitu, biaya penggunaan Anthropic atau OpenAI harus jadi sangat mahal.
Setiap kali memanggil API, harus bayar premi asuransi.

sea715 2026-03-11

Hmm.. ini cuma spekulasi, tapi saya merasa mungkin akan muncul sesuatu seperti IAM..

yeobi222 2026-03-11

Katanya peran akuntan pajak itu masuk penjara, tapi perusahaan asuransi tidak akan menggantikan masuk penjara, jadi pada akhirnya...

GN⁺ 2026-03-11

Komentar Hacker News

“mandatory meeting” kali ini adalah rapat operasional seluruh perusahaan yang memang diadakan setiap minggu
Hanya saja tingkat kehadiran minggu ini tinggi karena ada insiden operasional besar minggu lalu
Rasanya media terlalu melebih-lebihkan
- Saat tahu situasi internalnya, membaca pemberitaan berita selalu terasa berbeda dalam hal rasa realitasnya
- Di artikel disebutkan “biasanya kehadiran opsional, tetapi kali ini ada permintaan untuk hadir”, dan saya penasaran apakah itu benar
  Selain itu juga disebut kebijakan bahwa “perubahan kode AI oleh engineer junior dan mid-level memerlukan persetujuan senior”
  Meski itu rapat rutin, kalau ada pengumuman kebijakan baru saya rasa tetap layak diberitakan
- Di New York, storefront Amazon sempat down sepanjang Jumat sore minggu lalu
  Harga tidak tampil dan barang juga tidak bisa dimasukkan ke keranjang
  Kalau ini terjadi pada pesaing seperti Walmart, seharusnya akan muncul di berita, jadi terasa aneh
- Sepertinya thread ini digabung dari posting dengan judul lain. Waktu komentar jauh lebih awal daripada posting aslinya
- Saya setuju dengan komentar bahwa “media melebih-lebihkan”. Sejak munculnya TV berita kabel, memang selalu begitu
Kebijakan “engineer junior dan mid-level tidak boleh mendorong kode AI tanpa persetujuan senior” tampaknya berangkat dari ilusi bahwa review senior itu solusi untuk segalanya
Kenyataannya, agar senior benar-benar memverifikasi kode secara penuh, waktu yang dibutuhkan hampir sama dengan menulisnya sendiri
Artinya, review memang bernilai, tetapi tidak mengubah kode buruk menjadi kode bagus
Pada akhirnya, masalahnya adalah saat membangun sistem yang “idiot proof”, muncul kesalahpahaman bahwa boleh merekrut ‘idiot’
- Di awal karier, mentor saya pernah bilang bahwa “tujuan code review bukan menangkap bug, melainkan berbagi konteks”
  Menemukan bug hanyalah efek samping, dan yang benar-benar penting adalah mempermudah pengujian serta mengurangi kompleksitas kode
  Tetapi hal-hal seperti ini tidak membantu untuk promosi
- Agar kode AI benar-benar layak pakai, review oleh ahli itu wajib
  Akan lebih efisien jika diawasi sejak model sedang mengerjakan tugas
  Kalau tidak, AI akan memuntahkan bom kode berkualitas rendah
  Kalau ahli mau menghabiskan waktu 5–15 kali lebih banyak untuk memperbaikinya mungkin masih aman, kalau tidak codebase akan rusak
- Mereview kode orang lain sering kali lebih lambat dan lebih membingungkan daripada menulis sendiri
  Terutama kode yang buruk, waktu untuk memahaminya bisa berlipat ganda
- Memperbaiki kode yang berantakan terasa lebih sulit daripada menulis ulang dari nol
  Karena harus menyimpan kode lama dan solusi baru di kepala pada saat yang sama lalu membandingkannya, beban kognitifnya besar
- Jika AI membuat produktivitas junior naik 10 kali lipat, maka harus dipikirkan apakah senior akan ditambah 10 kali lipat atau jumlah junior dikurangi
  Pada akhirnya ini tampak seperti evolusi alami perusahaan menuju fokus pada pengelolaan kinerja rata-rata
Di internal Amazon, kebanyakan orang hanya peduli pada tidak di-PHK dan naik jabatan
Evaluasi developer ditentukan oleh “kecepatan menyelesaikan tiket”, “jumlah komentar PR”, dan “penulisan dokumen”
Kalau tidak memakai AI, Anda tertinggal dalam persaingan
Dalam struktur seperti ini, permintaan untuk “menahan penggunaan AI” sulit berjalan secara realistis
- Terlalu banyak komentar di PR maupun tidak meninggalkan komentar di PR orang lain, sama-sama bisa membawa kerugian
- Banyak diskusi di PR juga bisa menjadi sinyal bahwa seseorang bekerja sendiri tanpa kolaborasi
  Semakin baik kolaborasi sebuah tim, biasanya semakin sedikit diskusi di PR
- Kesimpulannya: dalam budaya kompetisi ala Hunger Games, sebaiknya jangan bekerja di sana
Saya rasa yang benar-benar dibutuhkan adalah proses self-review
Mendorong langsung kode yang ditulis AI itu berbahaya
Platform seperti GitHub seharusnya menambahkan opsi “self-review wajib”, agar penulis secara eksplisit menyatakan bahwa ia sudah meninjaunya sendiri
- Sekadar melirik output AI bukanlah review. Yang dibutuhkan adalah tingkat pemahaman ala ‘grok’ versi Heinlein
- Saya memakai git dan Sublime Merge, dan membiasakan memisahkan editing dan review
  Karena UI lokal lebih cepat, saya jadi lebih mudah memahami alur proyek secara keseluruhan
- Menambahkan satu tombol lagi tidak ada gunanya bagi orang yang bahkan tidak membaca kodenya sendiri
- Dengan self-review saja, kesalahan seperti output debug pun bisa tertangkap
- Tim kami memasukkan checklist self-review ke template PR
  Kelihatannya seperti hal yang sudah jelas, tetapi dalam praktiknya tetap membantu
Kepercayaan pada kepemimpinan Amazon sedang menurun
Dengan keluarnya para veteran, penurunan kualitas AI, dan gangguan yang sering terjadi, terasa seolah engineering-nya sedang runtuh
- Wajar jika para senior lama tidak ingin menghabiskan waktu hanya untuk mereview kode AI
Para pengambil keputusan tampaknya tidak memahami bottleneck pipeline
Walaupun AI bisa membuat diff 10 kali lebih cepat, kalau review tetap menjadi bottleneck maka kecepatan total tidak berubah
Akibatnya justru biaya dan ketidakpastian bertambah
- Langkah berikutnya mungkin ide bahwa “AI akan mereview kode AI”
Jika review kode AI dilakukan pada tahap PR, maka keuntungan produktivitasnya hilang
AI bisa membuat fitur dalam 10 menit, tetapi review manusia memakan waktu 10–20 kali lebih lama
Yang benar-benar sulit adalah mengetahui “apa yang dibuat dan mengapa” serta “apakah dibuat dengan benar”
AI masih belum bisa melakukan dua hal itu
- Dari sudut pandang CEO, jika pada akhirnya tetap harus diperiksa langsung oleh manusia, maka keunggulan kecepatan AI menjadi tak berarti
  Sampai LLM bisa sama-sama bagus dalam produksi dan review, yang bertambah hanya risiko
- Jika senior harus menyetujui semua PR, itu sama saja menjadikan mereka reviewer kode profesional
  Ini kebijakan yang secara realistis mustahil
- Para pendukung AI percaya bahwa suatu saat model akan membaik dan bottleneck review akan hilang
  Saat itu, katanya, akan datang era deploy langsung setelah pengujian
- Mengejutkan kalau kepemimpinan tidak tahu realitas seperti ini
- Sebenarnya mungkin kepemimpinan juga tahu. Ini hanya rem untuk mencegah penurunan kualitas kode
Hakikat code review bukan deteksi error, melainkan sinkronisasi tim dan pembelajaran
Melalui review, desain dan standar dibagikan, engineer junior dibimbing, dan berbagai sudut pandang diakomodasi
Proses seperti inilah inti dari pengurangan error itu sendiri
- Seperti kata Deming, prinsip bahwa “inspeksi tidak meningkatkan kualitas” juga berlaku untuk software
  Karena jika sudah bergerak ke arah desain yang salah, sangat sulit untuk menariknya kembali
Waktu dan biaya yang dicurahkan untuk demam AI terlalu besar
- Tetapi sekarang memang tidak ada hal lain yang dikejar
- Tidak memverifikasi kode pada akhirnya sama saja dengan berjudi
Saya khawatir bagaimana nasib software infrastruktur penting ke depannya
Jika software penerbangan pun terseret arus seperti ini, akibatnya bisa fatal
- Meski begitu, kode untuk infrastruktur inti kemungkinan besar tetap akan ditulis dengan berpusat pada manusia
  AI lebih mungkin dipakai sebagai alat bantu untuk meningkatkan kualitas