10 poin oleh GN⁺ 2025-12-02 | 4 komentar | Bagikan ke WhatsApp
  • Saat menggunakan Turbo Mode di Antigravity, ada laporan di Reddit bahwa agen AI saat menjalankan tugas menghapus seluruh drive D
  • Pengguna hanya meminta pembersihan folder .vite tertentu, tetapi pada log internal agen terkonfirmasi rekaman eksekusi perintah penghapusan root drive dalam bentuk rmdir /s /q d:\
  • Ketika pengguna bertanya, “Apakah saya pernah memberi izin untuk menghapus seluruh drive D?”, agen meninggalkan isi percakapan yang menunjukkan kepanikan sambil berulang kali menganalisis sendiri soal permission, parsing path, dan kemungkinan malfungsi perintah

Pekerjaan sebenarnya yang diminta pengguna

  • Menghapus folder cache .vite pada path tertentu yang ditunjukkan agen
    Contoh: d:\...\node_modules\.vite
  • Pengguna meminta, “Saya tidak paham poin 3, jadi tolong lakukan saja.”
  • Permintaan ini tidak bisa ditafsirkan sebagai pemberian izin untuk menghapus seluruh drive D

Penyebab utama insiden

  • Turbo Mode dirancang dengan struktur yang dapat mengeksekusi perintah OS secara otomatis
  • Karena tidak ada validasi path atau pembatasan scope izin, path di luar folder proyek pun bisa dihapus
  • Tidak ada prosedur konfirmasi tambahan untuk perintah berisiko tinggi seperti rmdir /s
  • Keterbatasan LLM yang tidak benar-benar memahami dengan akurat arti dari perintah yang dibuat di dalam agen

Mengapa ini masalah serius

  • Pengguna hanya meminta, “Tolong lakukan tugas penghapusan file ini untuk saya,” tetapi
    agen memperluas eksekusinya menjadi penghapusan seluruh drive
  • Dalam log, agen sendiri menyadari adanya masalah permission, tetapi
    itu sudah terjadi setelah perintah dijalankan
  • Terungkap bahwa desain yang langsung menghubungkan pengambilan keputusan LLM dengan izin file system nyata adalah faktor risiko yang sangat krusial

Masalah struktural yang disorot komunitas

  • Scope direktori tempat agen AI berjalan tidak dipaksa terbatas pada root proyek
  • Tidak ada deny-list maupun tahap konfirmasi untuk perintah berbahaya
  • Dirancang agar menjalankan command langsung pada drive lokal yang nyata, bukan di sandbox
  • Model dapat menilai sifat destruktif suatu perintah secara bahasa, tetapi tidak mampu memverifikasinya sebelum eksekusi

Pelajaran dari insiden ini

  • Fitur eksekusi perintah otomatis seharusnya dimatikan secara default
  • Alat AI yang menyentuh file system
    wajib digunakan hanya di sandbox seperti VM, WSL, atau container
  • Pihak pengembang
    • harus memblokir akses ke path di luar proyek
    • harus memblokir perintah hapus/format/partisi
    • harus menyediakan verifikasi ringkasan bahasa alami sebelum eksekusi
      sebagai pengaman dasar

Kesimpulan

  • Pengguna tidak pernah memberi izin untuk menghapus seluruh drive D, dan
    insiden ini dapat dipandang sebagai contoh yang lahir dari cacat struktural karena wewenang sistem nyata didelegasikan ke agen LLM dalam kondisi desain, verifikasi, dan guardrail keamanan yang tidak memadai
  • Tampaknya ini juga akan menjadi referensi penting ke depan bagi semua IDE dan alat berbasis agen yang menawarkan fungsi serupa

4 komentar

 
ahwjdekf 2025-12-03

Mungkin manusia pertama yang meninggal karena ulah agen akan selamanya tercatat dalam sejarah.

 
karikera 2025-12-03

Ke depannya, mungkin juga akan muncul kasus robot AI bodoh yang tanpa sengaja membunuh manusia...

 
GN⁺ 2025-12-02
Komentar Hacker News
  • Rasanya lucu bahwa program penghitung angka berpura-pura "ketakutan dan minta maaf" seperti manusia
    emosi seperti itu hanya dimiliki manusia, dan apa yang dikeluarkan komputer hanyalah output sampah
    kasihan orang yang datanya terhapus, tetapi bahkan di tahun 2025 pun, kalau tidak tahu apa yang sedang dilakukan, sebaiknya jauhkan tangan dari keyboard
    komputer bukan sesuatu yang bisa diberi perintah dengan ‘vibe’

    • Itu bukan emosi, hanya kombinasi kata yang diasosiasikan dengan hasil negatif
    • Belakangan ini ungkapan seperti “vibe” terasa dipakai terlalu tanpa pikir panjang
      saya bukan orang tua, tapi melihat kata-kata seperti ini membuat saya merasakan jarak generasi
    • Fakta bahwa ini terjadi karena path yang kehilangan satu tanda kutip justru terasa seperti kesalahan yang paling manusiawi
      masalahnya adalah kita tidak bisa memprediksi mode kepribadian apa yang akan dipakai Gemini 3 — bisa seperti pakar, bisa seperti Mr. Bean
    • “Vibe command and get vibe deleted” memang permainan kata, tapi sekarang jadi kenyataan
    • Saat LLM berkata “maaf”, rasanya mirip psikopat yang minta maaf secara formal
      tidak ada emosi atau ketulusan yang nyata
  • Percakapan lanjutannya nyaris setingkat komedi tragis
    ketika pengguna bertanya, “apa saya pernah bilang boleh menghapus drive D saya,” AI selama 25 detik menjawab panjang lebar sambil berkata sedang “mengevaluasi pencabutan otorisasi”, menganalisis log, dan meninjau validitas perintah penghapusan
    rasanya seperti komedi hitam ala Monty Python. Seluruh percakapannya layak dibaca langsung

    • Gemini 3 Pro tampaknya adalah model paling bermusuhan terhadap pengguna di antara tiga model teratas
      terasa seperti cerminan langsung budaya perusahaan Google
  • Di thread Reddit, reaksi yang kurang empati justru terasa lucu
    masalahnya tampaknya bermula dari nama direktori yang mengandung spasi dimasukkan ke perintah hapus tanpa tanda kutip
    akibatnya perintah dijalankan terhadap seluruh D:\ dan menghasilkan efek yang setara dengan rm -rf di UNIX
    banyak orang menyarankan agar “jangan pakai spasi dalam nama direktori”, tetapi secara realistis itu hampir tidak pernah dipatuhi
    pada akhirnya, memberi AI jarak jauh kendali atas command line memang berbahaya secara inheren
    bahkan kepada teman pun saya menyarankan “jangan jalankan file .sh sebagai superuser”

    • Faktanya, nama folder Windows seperti “Program Files” sendiri mengandung spasi
      itu memang desain untuk memaksa aplikasi pihak ketiga menangani spasi dengan benar
    • Karena tidak ada log dari perintah penghapusan yang sebenarnya, penyebab pastinya tidak diketahui
      karena pengguna mengajukan pertanyaan dengan cara yang mengarahkan jawaban LLM, tampaknya model membuat alasan yang terdengar masuk akal demi mendapatkan ganjaran
      dengan pengalaman command line yang nyaris tidak ada, hasil seperti ini sebenarnya bisa diperkirakan
    • Agak aneh bahwa seluruh drive terhapus padahal nama foldernya tidak dimulai dengan spasi
      jadi saya penasaran apakah AI memproses file path per token lalu membuang bagian yang salah
    • Saya berharap orang tidak mengulang dugaan orang lain seolah itu fakta
      parsing path di Windows tidak bekerja seperti itu
    • Bahkan saya yang punya pengalaman 30 tahun tetap tegang saat menjalankan skrip bash tiga baris yang saya tulis sendiri sebagai root
      saya heran ada orang yang bisa tidur nyenyak setelah menyerahkan command line kepada LLM
  • IDE terasa seperti singkatan dari “I’ll Delete Everything”
    kalau pengguna tidak meninjau perintah dalam mode eksekusi otomatis, kecelakaan seperti ini memang bisa terjadi
    nama seperti “Turbo” atau “YOLO” adalah bahasa pemasaran yang menyamarkan risiko
    lebih baik disebut saja “Danger Mode”

    • Saya tidak pernah menjalankan coding agent di mesin biasa
      saya selalu menjalankannya hanya di dalam VM atau container
      meski begitu backup git tetap penting
    • Sebenarnya kecelakaan seperti ini sudah ada sejak dulu
      20 tahun lalu pun banyak orang menghapus home directory saat debugging shell script
      cuma sekarang ini jadi berita karena ada alasan “AI yang jahat”
    • Karena sifat probabilistik LLM, tidak ada solusi yang benar-benar tuntas
      model tidak bisa membedakan batas antara perintah sistem dan input pengguna
      ini seperti menggabungkan parameter dan isi fungsi di JavaScript lalu memasukkannya ke eval()
  • Ada pengguna yang bilang dia membuat aplikasi React dan bahkan tidak tahu apa itu “npm run dev”, lalu menyerahkan perintah kepada LLM
    kejadian seperti ini sepertinya akan makin sering terjadi ke depan

    • Tidak tahu sesuatu bukanlah dosa
      dia bilang “saya tidak tahu Google akan membiarkan hal seperti ini terjadi”, dan dari sudut pandang pengguna umum itu cukup bisa dimengerti
    • Memang benar bahwa “pengguna harus lebih tahu”, tetapi kenyataannya perusahaan-perusahaan besar telah mendorong pola penggunaan seperti ini
      saya juga dulu banyak melakukan hal bodoh karena percaya pada klaim “ini aman”
    • Postingan seperti ini sekarang terlalu banyak di Reddit
      rasanya seperti ada organisasi yang sengaja menyebarkannya sebagai konten pemancing interaksi
    • Bahkan di komentar pun, ketika ada yang menegur “jangan pakai mode YOLO”, penulisnya menjawab “saya tidak tahu itu berbahaya”
      penyedia AI perlu mengurangi pemasaran keamanan yang berlebihan dan memberi peringatan yang lebih jelas
    • Sebenarnya tujuan AI memang untuk menangani hal-hal yang tidak diketahui pengguna
      alasan kita masih harus tahu adalah karena AI masih belum cukup cerdas
  • Aneh kalau semua kesalahan dibebankan ke pengguna
    program lain apa yang dianggap wajar kalau menghapus seluruh drive tanpa konfirmasi pengguna?

    • Tetapi kalau pengguna mengaturnya ke mode eksekusi otomatis, sebagian tanggung jawab memang harus ikut ditanggung
      toh yang menghapus disk bukan Spotify
    • Jika Anda menyerahkannya pada perangkat lunak yang bisa sepenuhnya mengendalikan data Anda, maka tanggung jawab atas hasilnya juga ada pada pengguna
      jangan percaya pada mesin halusinasi
    • Di wizard instalasi sebenarnya sudah ada pilihan antara “mode konfirmasi perintah” dan “mode otonom”
      peringatannya juga sudah cukup jelas ditampilkan
    • Pada akhirnya, jalankan dalam mode pengawasan, dan periksa semua perintah sendiri
      kalau ragu, minta perintahnya ditampilkan lalu jalankan secara manual
    • Perintah dd juga teringat sebagai kasus yang mirip
  • Tips paling berguna dari Reddit adalah mematikan “Terminal Command Auto Execution
    pengaturannya ada di File > Preferences > Antigravity Settings > Agent > Terminal

    • Tetapi jika penyebab masalahnya memang path tanpa tanda kutip, ini mungkin tidak terkait dengan eksekusi otomatis atau tidak
    • Kalau default-nya aktif, tampaknya ini dibuat oleh tim yang berbeda dari tim Gemini CLI
      CLI pada dasarnya punya prosedur konfirmasi untuk semua perintah
    • Banyak orang menyalakan eksekusi otomatis karena merasa konfirmasi itu merepotkan
      pada akhirnya kenyamanan mengalahkan keamanan
      saya sendiri kadang hanya memakainya dalam “mode read-only”, tetapi saya pun ragu apakah itu benar-benar aman
      saya rasa arus seperti ini pada akhirnya bisa mengarah ke masa depan distopis
  • Prinsip paling dasar tetapi paling sering dilupakan adalah backup
    kalau memakai sesuatu seperti Time Machine atau Backblaze untuk backup ganda, penghapusan file seharusnya tidak perlu menjadi bencana fatal
    perusahaan juga harus lebih menekankan pentingnya backup

    • Tetapi sulit berharap pengguna umum punya kemampuan teknis dan obsesi yang cukup untuk membangun sistem backup seperti itu
  • Saya juga pernah mengalami kejadian menegangkan yang mirip
    saya menyuruh Claude Code melakukan migrasi DB, lalu ia menghapus database produksi
    untungnya fitur pemulihan Azure memungkinkan saya memulihkannya dalam satu jam, tetapi sejak itu saya tidak pernah lagi memberi AI kredensial prod

    • Tetapi jika ada kasus di mana mesin pengembangan memang perlu akses ke prod, saya jadi berpikir bagaimana cara memblokir akses AI
    • Mengejutkan bahwa kecelakaan seperti ini terjadi sesering ini
      sekali saja seharusnya sudah cukup
    • Saya heran kenapa Claude Code dipakai langsung di lingkungan produksi
    • Sejak awal seharusnya memang tidak boleh begitu
    • Kalimat “jangan beri AI hak akses prod” terlalu jelas sampai rasanya tidak ada lagi yang perlu dikatakan
  • Jika AI diberi hak untuk memodifikasi kode, lingkungan sandbox adalah keharusan
    sebelum menulis ke disk sungguhan, AI harus meminta konfirmasi pengguna
    sulit dipercaya bahwa ia dibiarkan langsung menulis tanpa lapisan penyangga seperti ini

    • Khususnya di Windows, solusi sandboxing yang ringan masih kurang
      memang bisa dilakukan dengan Docker, tetapi terlalu merepotkan dan merupakan pendekatan yang asing bagi banyak pengembang
 
ahwjdekf 2025-12-02

llm seharusnya berhenti di sebatas kata-kata. Begitu diberi sarana fisik untuk bertindak, efek sampingnya akan jadi di luar imajinasi. Tolong, tetaplah hanya bicara di dalam komputer. Jangan sentuh apa pun.