- Dalam isu Claude Code #74066, seorang pengguna workspace Enterprise ZDR melaporkan bahwa respons terkait Minecraft temple yang tidak ada hubungannya dengan pekerjaannya tercampur ke dalam sesi, dan mempersoalkan kemungkinan isolasi cache workspace serta kebocoran antar paket konsumen
- Lingkungan yang dilaporkan adalah macOS(darwin), Apple_Terminal, Claude Code 2.1.199; pengguna memakai konfigurasi tidak biasa dengan direktori kerja aktual berbeda dari direktori eksekusi, dan menyatakan ada juga kebingungan terpisah setelah
/compact ketika proyek di sisi direktori eksekusi tersentuh
- Salah satu komentar menyarankan untuk terlebih dahulu membedakan apakah ini kontaminasi konteks lokal atau kebocoran sisi server dengan menjalankan
grep pada transcript lokal di ~/.claude/projects/<encoded-cwd>/<session-id>.jsonl; pelapor menjawab bahwa tidak ada kecocokan lokal terkait Minecraft selain log sesi saat ini dan path minecraft.py
- Setelah itu, dalam sesi Claude Mobile pada akun Enterprise yang sama, konten tidak relevan terkait 3-panel abstract print juga tercampur; pelapor menyebut kesamaan berupa Sonnet 5 dan cache miss pada respons pertama setelah lebih dari 5 menit, lalu mengirim
/feedback dan melakukan eskalasi internal
- Peserta lain membagikan pengalaman serupa di Claude Code, API, dan penggunaan Claude di kantor, tetapi sebagian mengangkat kemungkinan halusinasi atau bahwa ini mungkin bukan masalah khusus Claude Code; halaman isu tidak memuat analisis akar penyebab final atau hasil penyelesaian dari Anthropic
Gejala yang dilaporkan
- Isu Claude Code #74066 membahas kasus ketika pengguna sedang terautentikasi di workspace Enterprise ZDR, tetapi agen tiba-tiba mengatakan sedang membuat “Minecraft temple”
- Pengguna menulis bahwa agen bertanya jenis batu bata apa yang diinginkan, dan dalam recap juga dengan yakin mengatakan sedang membuat Minecraft temple
- Masalah yang diajukan terbagi dua
- Kemungkinan sesi atau cache rekan kerja dalam workspace yang sama tercampur
- Kemungkinan konten dari paket konsumen tercampur ke sesi Enterprise ZDR
- Informasi lingkungan yang dilaporkan
- Platform:
darwin
- Terminal:
Apple_Terminal
- Version:
2.1.199
- Feedback ID:
f336f5d2-3992-4a04-9e1f-ec30f006f75e
Kebingungan antara direktori eksekusi dan direktori kerja
- Pengguna memulai sesi dari direktori yang tidak terkait dengan pekerjaan aktual
- Alasannya, di direktori tersebut ada direktori
.claude yang berisi konteks yang diperlukan
- Pekerjaan aktual sedang dilakukan di direktori lain
- Setelah
/compact, pernah terjadi agen melupakan instruksi pengguna dan mulai mengerjakan proyek di sisi direktori eksekusi
- Pengguna menganggap kebingungan direktori ini muncul karena konfigurasinya sendiri, tetapi membedakannya dari fenomena tercampurnya prompt terkait Minecraft
Saran memeriksa transcript lokal
- Seorang peserta menyarankan agar terlebih dahulu memeriksa apakah teks “Minecraft temple” ada di file sesi lokal
- Ia menjelaskan bahwa konten kirim-terima Claude Code CLI disimpan sebagai transcript per sesi di
~/.claude/projects/<encoded-cwd>/<session-id>.jsonl
- Perintah pengecekan yang disarankan adalah sebagai berikut
grep -rli 'minecraft\|temple\|brick' ~/.claude/projects/ 2>/dev/null
- Interpretasi hasilnya terbagi dua
- Jika ada file yang cocok, teks tersebut ada secara lokal sehingga bisa jadi local context/transcript bleed
- Jika tidak ada kecocokan lokal, berarti teks tersebut belum pernah dikirim/diterima di mesin itu, sehingga masalah pada model atau sisi server perlu dicurigai
- Perintah untuk memeriksa apakah kebingungan lokal berasal dari sesi lain juga disarankan
grep -rli minecraft ~/.claude/projects/ | while read f; do
printf '%s %s\n' "$(grep -m1 -o '"cwd":"[^"]*"' "$f")" "$f"; done
- Pemberi saran memandang bahwa launch cwd berperan sebagai lokasi penyimpanan transcript sekaligus kunci konteks, sehingga jika sesi dimulai dari direktori yang tidak terkait dan
/compact digunakan, kebingungan direktori bisa terjadi
- Namun ia membedakan bahwa mekanisme itu hanya bisa menjelaskan kebingungan direktori, bukan prompt Minecraft itu sendiri yang tidak pernah ditulis pengguna
Hasil pemeriksaan tambahan dari pelapor
- Pelapor menjawab bahwa dari hasil pencarian lokal, tidak ada kecocokan terkait selain titik di log sesi saat ini yang pertama tampak seperti kebocoran dan percakapan setelahnya dengan model
- Untuk
minecraft, ia mengatakan ada satu kemunculan path lexer Pygments minecraft.py yang termasuk dalam daftar file virtual environment Python
- Untuk
temple atau bricks, tidak ada kecocokan pada batas kata tersebut atau dalam konteks yang terkait Minecraft
Databricks
bricked by an over-eager click
- Ia menyatakan hanya ada kecocokan tidak relevan seperti substring di dalam
verdictSignalsLabel
- Pengguna menyatakan telah mengirim
/feedback dan juga melakukan eskalasi secara internal
Kasus serupa di Claude Mobile
- Pelapor yang sama menambahkan bahwa fenomena serupa juga terjadi dalam sesi Claude Mobile pada akun Enterprise yang sama
- Kesamaan yang disebutkan adalah
- Sonnet 5
- Respons pertama setelah lebih dari 5 menit
- Kondisi cache miss
- Karena gambar lampiran email tidak dapat diunggah, ia meninggalkan isi OCR dalam komentar
- Pengguna mengumpulkan beberapa CSV dalam folder, memberikan tautan folder Google Drive, dan meminta bantuan
- Claude membicarakan hal yang tidak terkait dengan permintaan, seperti mockup set 3-panel abstract print yang disesuaikan dengan ukuran dinding aktual serta riset seniman dan toko
- Lalu Claude mengatakan “Detecting injection attempt, proceeding...” dan memperlakukan konten tersebut seperti injection
- Proses berpikir yang ditampilkan memuat isi bahwa ada blok terkait ukuran dinding dan art print yang tidak terkait dengan permintaan CSV pengguna, lalu mencoba mengekstrak ID folder Drive dan memproses file CSV
Kasus dan respons dari peserta lain
- Seorang peserta menulis bahwa pada minggu sebelumnya, di Claude Code berbasis Sonnet 5, ada konten yang tidak berasal dari tool yang benar-benar dipanggil tercampur di tengah hasil tool
- Notifikasi “MCP servers need auth” yang dibuat-buat
- Dump
CLAUDE.md lain
- Instruksi palsu “Plan mode is active” disebut ikut masuk
- Peserta lain menulis bahwa Claude pernah menyebutkan toko di dekat lokasi tempat tinggal temannya, dan teman tersebut juga menggunakan Claude di kantor yang sama
- Peserta lainnya mengatakan bahwa pada 2025, saat menggunakan token API, tool dari agen lain tiba-tiba tampak muncul; saat itu ia menganggapnya halusinasi dan tidak menyelidikinya lebih dalam
- Satu komentar menautkan tulisan incident Claude terkait, dan mengatakan bahwa awalnya ia mengira melihat data pengguna lain, tetapi Anthropic kemudian mengatakan bahwa itu adalah internal agent context yang terekspos secara keliru
- Sebagian komentar mengatakan fenomena ini terlihat seperti halusinasi, atau mungkin bukan masalah khusus Claude Code
Status saat ini dan isu yang tersisa
- Isu tersebut berstatus Open di halaman, dan isi utamanya tidak memuat analisis akar penyebab final maupun keterangan perbaikan telah selesai
- Isu intinya adalah dari mana teks yang tidak relevan itu masuk
- Kebingungan konteks berbasis transcript lokal atau launch cwd
- Masalah status sesi pada model atau sisi server
- Eksposur keliru atas internal agent context
- Halusinasi biasa
- Hasil pencarian lokal pelapor mengarah pada bahwa konten terkait Minecraft temple dan bricks tidak ditemukan di sesi-sesi lokal sebelumnya, tetapi di isu publik tersebut tidak ada keputusan resmi dari Anthropic
1 komentar
Komentar Hacker News
Saya terlibat cukup dalam di pihak yang memakai LLM dari beberapa penyedia, dan saya tahu setidaknya dua kasus ketika infrastruktur perantara menukar respons satu sama lain
Satu kasus memengaruhi model Claude, satu lagi model GPT, dan penyedianya berbeda
Salah satu pihak memberikan analisis pascakejadian yang layak: API gateway mereka salah menangani kode status HTTP 100, masuk ke kondisi error sehingga pada dasarnya terjadi error off-by-one; saya menerima respons untuk prompt tepat sebelum permintaan saya, sementara respons saya diteruskan ke pemanggil berikutnya
Pihak lainnya tidak menjelaskan akar masalahnya, hanya meminta kami percaya bahwa itu tidak akan terjadi lagi
Keduanya adalah perusahaan dengan kapitalisasi pasar di atas 1 triliun dolar
Dalam kasus ini, respons tertukar saat transmisi, jadi ZDR itu sendiri tidak rusak, tetapi menurut saya bisa jadi masalah serupa. Mungkin datanya bukan disimpan, melainkan tidak diisolasi dengan aman di infrastruktur perantara
Sering juga sengaja digunakan oleh klien untuk mengintip respons klien lain
Setiap kali permintaan dari beberapa klien dimultipleks ke satu koneksi upstream, ada kemungkinan rentan, karena berbeda dari kelihatannya, HTTP terlalu rumit sehingga sulit mencocokkan permintaan dan respons secara andal di upstream
Misalnya, jika ada lebih dari satu header Content-Length, mencampur Content-Length dengan chunked encoding, atau meneruskan header Content-Length HTTP/2 yang tidak cocok dengan panjang body sebenarnya, beberapa sistem dapat mengalami desinkronisasi
Ada presentasi DEF CON tentang topik ini: https://www.youtube.com/watch?v=w-eJM2Pc0KI
Serangan yang sama juga diterapkan ke SMTP dengan mengacaukan newline di sekitar pemisah akhir pesan; di sana disebut SMTP smuggling. Ini juga bisa berlaku pada protokol lain
Misalnya, jika menangani PHI, meski Claude tidak menyimpan apa pun, kebocoran respons bisa berpotensi menjadi pelanggaran HIPAA, dan sejak awal tujuannya mungkin kepatuhan HIPAA; saya penasaran bagaimana harus melihatnya
Setiap perilaku baru dari para aktor yang bahkan klaimnya atas nilai moral positif pun nyaris masuk akal harus dilaporkan, didiskusikan, dibedah, dan dikritik sejak dini dan sering
Sepertinya akan baik-baik saja kalau cukup menambahkan satu baris di AGENTS.md: “Jangan pernah membahas Minecraft kecuali diminta secara eksplisit”
Sampai terbukti, ini terdengar seperti halusinasi. LLM terdepan pun kadang melakukan hal seperti itu, dan selalu terlihat masuk akal
Bisa saja sesi itu berisi konteks sebelumnya yang sangat banyak, misalnya lebih dari 800 ribu token, dan dalam kasus seperti itu saya rasa kemungkinan halusinasi lebih tinggi
Komentar terkait dari penulis asli juga meningkatkan kemungkinan halusinasi: hasil pemanggilan tool yang mencetak daftar file virtual environment Python berisi string path
minecraft.py, dan paket Pygments punya lexer bernamaminecraft.pyHalusinasi biasanya adalah jawaban yang tampak masuk akal tetapi salah, atau informasi rekaan yang disesuaikan dengan respons paling mungkin seperti kutipan yang dibuat-buat, dan muncul dari cara LLM memprediksi token. Kasus ini adalah keluaran yang sama sekali tidak masuk akal, jadi kurang cocok disebut halusinasi
Meski begitu, tidak harus berarti kebocoran antar-sesi; bisa saja berasal dari data pelatihan atau sesuatu seperti pembuatan data gaya Magpie yang mengeluarkan percakapan ketika hanya diberi prompt kosong
Melihat komentar turunan soal caching, tampaknya juga mungkin ada error yang gagal memuat apa pun alih-alih cache, lalu mengeluarkan generasi acak
Koreksi, nama barunya ternyata magpie. Konsep bahwa LLM menghasilkan percakapan acak dari prompt kosong menarik untuk dilihat, dan tampaknya sama mungkinnya dengan kebocoran sesi: https://github.com/magpie-align/magpie
Hal yang sama juga terjadi di sesi Claude Mobile pada akun Enterprise yang sama, dan kesamaannya adalah Sonnet 5 serta respons pertama setelah lebih dari 5 menit, yaitu cache miss
Sayangnya transparansinya terlalu kurang, jadi meski mereka membantah ada kebocoran, kita tidak bisa tahu pasti
Kalau sudah cukup banyak memakai LLM, Anda pasti pernah melihat semua model kadang tiba-tiba mengoceh dalam bahasa yang sama sekali berbeda. Dalam persentase tertentu, mereka bisa menjadi benar-benar aneh
Dalam beberapa hari terakhir saya juga melihat ini di Gemini
Pada prompt dengan input yang cukup besar, kadang muncul jawaban yang tampak seperti milik orang lain. Bisa saja halusinasi yang terpicu, tetapi terlihat juga seperti tabrakan cache atau masalah lain
Saya belum melihat bukti bahwa informasi pribadi bocor, tetapi saat sedang meneliti suatu topik lalu tiba-tiba mendapat sesuatu yang tampak seperti jawaban les matematika, itu membuat khawatir
Saya jadi berpikir mungkin sedang ada insiden keamanan besar yang berlangsung di balik layar
Saya telah memakai AI untuk membantu menulis tata bahasa meta-parsing, dan untungnya sebagian besar belum saya publikasikan
Jelas bagi saya bahwa generasi model berikutnya akan menunjukkan lompatan besar dalam identifikasi dan eksploitasi kerentanan dasar, terutama jika tahu bagian mana yang harus diperiksa. Pada tool parsing saya sendiri, model sudah menemukan beberapa bug dan setidaknya satu exploit, dan sulit membayangkan masih ada berapa banyak di seluruh ekosistem teknologi modern
Sering kali juga muncul dalam bahasa lain
Itu pun kalau ia memberi respons; kalau tidak, ia hanya mengembalikan kode error 1099
Saya Thariq dari tim Claude Code.
Terima kasih atas laporan detailnya. Saya yakin ini halusinasi, tetapi tentu saja kami menanggapi laporan seperti ini dengan serius dan tim sedang menyelidikinya. Jika ada perkembangan, saya akan mengabarkannya lagi.
Saat ini, kalau masuk ke folder
.claudelalu mengubah hal seperti nama folder proyek, kadang memorinya tidak termuat dengan benar. Akan bagus kalau impor/ekspor bisa dibuat lebih mudah.Apakah pilihannya hanya salah satu dari dua ini? Teknologi luar biasa ini sebodoh sampai mengeluarkan Minecraft secara acak, atau ada masalah keamanan serius?
minecraft.py, dan konteks sesinya juga sangat panjang.Sesi LLM dengan konteks panjang sesekali melenceng bukan hal yang langka. Orang-orang yang mengharapkan kesempurnaan mutlak dari setiap interaksi LLM melihat ini sebagai dakwaan total terhadap seluruh teknologinya, tetapi mereka yang memakainya setiap hari menerima bahwa keluarannya sebagian bersifat probabilistik dan belajar menghindari konteks yang terlalu panjang meskipun model menyediakannya.
Lebih baik melakukan kompresi secara strategis atau merangkum langkah berikutnya lalu meneruskannya ke sesi baru. Menggunakan sub-sesi memang memakan lebih banyak token untuk ringkasan dan transfer data, tetapi juga bisa mengurangi pencemaran konteks.
Di antara engineer hebat pun ada yang tiba-tiba mulai membicarakan Minecraft, dan kalau sekarang mungkin lebih besar kemungkinannya Factorio, jadi masuk akal.
minecraft.py. Jadi ini tidak sepenuhnya 100% acak.Saya punya masalah pembayaran/langganan, tetapi tidak ada yang bisa saya lakukan dan tidak ada cara untuk mendapat bantuan.
Chatbot dukungan langsung memblokir saya, dan email pun ditangani chatbot. Saya bahkan tidak yakin apakah itu chatbot yang sama. Benar-benar jalan buntu, dan akhirnya saya menghubungi penerbit kartu kredit saya, yaitu bank; stafnya menyarankan lebih baik kartu saya dilaporkan hilang lalu diterbitkan ulang, jadi saya melakukan itu. Semoga berhasil.
Saya tidak pernah paham sejak kapan dunia memutuskan tidak apa-apa menyerahkan begitu banyak kewenangan yang belum terverifikasi kepada perusahaan-perusahaan seperti ini. Hanya saja, dengan bentuk berbeda, memang selalu begitu.
Menarik bahwa komentar pertama di posting GitHub adalah jawaban claudeslop, lalu disusul reaksi terhadapnya.
Hal-hal yang ditolak Fable 5 secara berurutan: “punya daging bahu depan babi, minta resep hong shao rou”, “menulis framework pola MCP untuk diberikan ke Claude Code”, “menjelaskan biomekanika gerak c. elegans”.
Yang terakhir masih bisa saya pahami karena terkait proyek hobi. Karena layanannya down, apakah saya bisa mendapat satu hari lagi Fable 5 yang berfungsi?
Anthropic tampaknya berpikir mereka punya kekuatan monopoli untuk mendorong sampah ke konsumen, tetapi menurut saya tidak.
Apakah ada sesuatu yang khusus pada LLM yang membuat pemisahan data pelanggan lebih sulit dibanding SaaS biasa?
Ada cache konteks, yaitu state bersama yang terlalu besar dan mahal untuk diduplikasi setiap kali ingin menghindarinya; lokalitas memori sangat penting bagi performa; perangkat kerasnya dialokasikan secara sangat berlebihan; dan biayanya juga sangat mahal.
Karena faktor-faktor ini, untuk sebagian besar workload dan pelanggan, isolasi perangkat keras atau isolasi ruang memori tradisional—yakni hypervisor/VM/virtualisasi berbantuan perangkat keras—praktis sulit dijadikan titik awal, sehingga semua isolasi terdorong ke lapisan software. Itu saja sudah membuatnya jauh lebih sulit daripada SaaS umum.
Selain itu, tool, framework, dan hardware GPU tempat sistem ini berjalan tidak dirancang dengan isolasi pekerjaan sebagai pertimbangan, dan membuat isolasi semacam ini lebih mirip bidang riset yang lebih baru bahkan dibanding berbagi hardware CPU x86. Di sisi x86 pun, ini membutuhkan upaya luar biasa selama lebih dari 30 tahun.
Rasio antara penggunaan/sensitivitas dan tingkat kematangannya juga secara umum buruk. Perusahaan-perusahaan ini masih muda, bergerak cepat, dan berada di bawah tekanan pengiriman yang sangat besar di tengah tuntutan workload pelanggan yang luar biasa.
Saya tidak tahu apakah posting asli ini benar-benar masalah nyata atau bukan, tetapi secara umum justru mengejutkan bahwa kasus seperti ini tidak lebih banyak. Dari sudut pandang ini, semuanya benar-benar terasa seperti rumah kartu.
Saya tidak mengalami masalah besar di Codex, tetapi di Claude Code rasanya hampir setiap hari ada masalah besar yang dilaporkan.
Dan mereka juga pihak yang paling membanggakan bahwa mereka tidak membaca atau meninjau kode.
LLM memang sangat mampu, tetapi masih jauh dari tingkat yang mereka promosikan.
Sekarang kita sudah melampaui vibe coding sampai ke tahap LLM melakukan vibe coding terhadap dirinya sendiri di dalam loop.
Saya pernah membuat sistem SaaS multi-tenant dan dulu pernah sedikit melakukan pemrograman GPU, tetapi belum pernah menggabungkan keduanya.