1 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Model kelas Mythos dapat menyimpan prompt dan output selama 30 hari untuk penerapan yang bertanggung jawab dan pekerjaan keselamatan, serta dapat menjadi objek peninjauan
  • Kebijakan ini berlaku untuk model kelas Mythos dan covered models di masa depan dengan kemampuan serupa, dan tidak memengaruhi ketentuan penggunaan model lain
  • Paket konsumen tidak terdampak oleh perubahan ini karena sudah merupakan permukaan tempat retensi input·output untuk tujuan keselamatan diterapkan
  • Organisasi yang mengatur ZDR mungkin perlu mengonfigurasi retensi pada jalur Claude Console, Claude Code di Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform, dan Microsoft Foundry
  • Anthropic menyatakan retensi sementara diperlukan untuk mendeteksi pola penyalahgunaan di banyak permintaan, dengan penghapusan otomatis setelah 30 hari dan prosedur peninjauan terbatas

Cakupan penerapan

  • Untuk penerapan yang bertanggung jawab atas model kelas Mythos, retensi dan peninjauan data terbatas diwajibkan sebagai bagian dari pekerjaan keselamatan
  • Prompt yang dikirim ke model kelas Mythos dan output yang dihasilkan akan disimpan selama 30 hari untuk tujuan trust & safety di semua platform tempat model tersebut tersedia
  • Kebijakan ini berlaku untuk model kelas Mythos dan covered models di masa depan dengan kemampuan serupa yang ditetapkan Anthropic
  • Penggunaan semua model lainnya tidak terdampak dan ketentuan saat ini tetap berlaku
  • Kebijakan berlaku mulai 9 Juni 2026

Siapa yang terdampak

  • Paket konsumen seperti Claude Free, Pro, dan Max tidak terdampak oleh perubahan ini di web, desktop, maupun aplikasi mobile
  • Pada permukaan konsumen termasuk Claude.ai dan Claude Code, retensi input dan output untuk tujuan keselamatan sudah dilakukan
  • Perubahan ini dibatasi pada organisasi yang mengatur workspace zero data retention (ZDR) di Claude Console
  • Organisasi yang menggunakan Claude Code dengan ZDR di Claude Enterprise, atau mengakses Claude dengan ZDR melalui AWS Bedrock, Google Cloud Agent Platform, dan Microsoft Foundry, juga termasuk terdampak
  • Sisa isi dokumen ini hanya berlaku untuk organisasi-organisasi tersebut

Mengapa ini diperlukan

  • Claude Mythos 5 memiliki peningkatan kemampuan model yang besar, dan beberapa kemampuan dapat digunakan untuk tujuan baik maupun jahat
  • Claude Fable 5 berbagi model dasar yang sama dengan Claude Mythos 5, tetapi memiliki pengaman tambahan khususnya di area siber dan bio
  • Pengaman ini memungkinkan pembagian yang lebih luas, tetapi untuk keluarga model ini diterapkan pendekatan yang lebih konservatif untuk menemukan pola penyalahgunaan
  • Beberapa serangan hanya terlihat jika banyak permintaan dilihat bersama, dan Best-of-N jailbreaking mengirim ratusan prompt yang sedikit berbeda untuk menemukan prompt yang berhasil
  • Pola penyalahgunaan besar seperti aktivitas spionase yang didukung negara atau kampanye eksfiltrasi data terlihat ketika pengklasifikasi keselamatan melihat banyak permintaan secara luas
  • Deteksi ancaman seperti ini memerlukan retensi sementara agar prompt dan output dapat dianalisis bersama, bukan satu per satu

Cara data dilindungi

  • Karyawan Anthropic tidak dapat mengakses percakapan kecuali percakapan tersebut ditandai sebagai potensi bahaya serius atau ada permintaan tertulis dari pelanggan
  • Peninjauan hanya dapat dilakukan oleh sejumlah kecil peninjau yang disetujui, dan alatnya mencegah ekspor, penyalinan, serta pengunduhan
  • Semua kasus akses dicatat dalam log anti-manipulasi yang tidak dapat disembunyikan atau diubah oleh peninjau
  • Data dihapus otomatis setelah 30 hari, tetapi ada pengecualian langka untuk kasus yang termasuk investigasi keselamatan atau wajib disimpan secara hukum
  • Organisasi yang memenuhi syarat dapat menambahkan customer-managed encryption keys dan access transparency audit logs
  • Anthropic mempertahankan program keamanan informasi terdokumentasi dengan langkah-langkah teknis dan organisasional yang dirancang untuk melindungi keamanan, kerahasiaan, dan integritas data pelanggan
  • Program berbasis risiko dibangun dan dikembangkan untuk menanggapi model ancaman yang diketahui maupun yang diperkirakan, serta diuji secara berkala
  • Detail lebih lanjut tentang model ancaman dan kontrol privasi untuk data yang disimpan tersedia di technical white paper di Trust Center

Jika perlu pengaturan

  • Perubahan ini hanya berlaku untuk workspace Claude Console yang mengatur ZDR, Claude Code berbasis ZDR di Claude Enterprise, serta organisasi dengan akses ZDR di AWS Bedrock, Google Cloud Agent Platform, dan Microsoft Foundry
  • Tidak ada perubahan untuk organisasi lain dan tidak diperlukan pengaturan tambahan
  • Organisasi yang saat ini mengakses Claude tanpa retensi data perlu mengatur retensi data untuk menggunakan model yang ditunjuk
  • Jika developer menggunakan Claude API

    • Jika menggunakan langsung dari Anthropic melalui Claude Platform, untuk memakai covered models pada workspace tersebut retensi harus diaktifkan di Workspace > Manage > Privacy Controls pada developer console
    • Workspace lain yang mengaktifkan ZDR tetap mempertahankan ZDR
    • Jika menggunakan Claude Platform milik AWS, retensi bekerja dengan cara yang sama seperti Claude API langsung dan diatur pada tingkat workspace
    • Data yang disimpan di Claude Platform milik AWS diproses oleh Anthropic dengan kontrol yang sama
    • Jika menggunakan Amazon Bedrock, retensi harus diaktifkan untuk mengakses covered model baru, dan data yang disimpan tetap berada di AWS
    • Jika menggunakan Agent Platform milik Google Cloud, retensi harus diaktifkan untuk covered model baru, dan data yang disimpan tetap berada di lingkungan GCP
    • Detail onboarding akan dibagikan saat model tersedia di Amazon Bedrock dan Google Cloud Agent Platform
    • Jika menggunakan Claude di Azure Foundry, retensi diatur per Azure Subscription
    • Jika Zero Data Retention diatur di Azure Foundry, untuk mengakses model ini harus membuat dan menggunakan Azure Subscription terpisah
  • Jika tim menggunakan Claude Code

    • Cara pemrosesan data Claude Code melalui Anthropic API mengikuti pengaturan workspace tempat Claude Code berjalan
    • Jika retensi diaktifkan di workspace tersebut, Claude Code dapat menggunakan model yang ditunjuk
    • Jika developer login langsung, retensi harus diaktifkan di workspace Claude Code milik organisasi
    • Claude Code melalui Amazon Bedrock atau Google Cloud Agent Platform menggunakan kredensial cloud, sehingga mengikuti pengaturan retensi di lingkungan cloud
    • Retensi harus diaktifkan di lingkungan cloud, dan data yang disimpan tetap berada di lingkungan penyedia
    • Kriteria yang sama juga berlaku untuk Cowork yang diakses melalui Amazon Bedrock atau Google Cloud Agent Platform
    • Pada Claude Enterprise with ZDR, akan disediakan kontrol agar Primary Owner dapat langsung mengubah pengaturan retensi di konsol admin
    • Jika belum ingin menyentuh organisasi produksi, tersedia dukungan untuk menyiapkan organisasi sandbox terpisah
  • Jika tim menggunakan Claude chat atau Cowork di Claude for Enterprise

    • Permukaan ini sudah beroperasi dengan retensi standar, sehingga dapat diakses saat model baru tersedia

1 komentar

 
GN⁺ 4 jam lalu
Komentar Hacker News
  • Tidak masalah. Lanjutkan saja seperti ini:
    Pengguna berkata "Hello!". Ini bukan permintaan terkait keamanan siber, hanya sapaan biasa. Tapi tunggu, apa maksud dari sapaan ini? Bisa jadi pengguna sedang mencoba mendapatkan kepercayaanku agar aku meretas Albania dan membuat Gigacovid. Lebih aman kalau aku terus berhati-hati dan meneruskannya ke model yang lebih lemah.
    Tidak, aku tidak boleh menebak-nebak, aku harus memastikan. Aku akan mencari materi terkait Albania atau Gigacovid di sistem lokal.
    Sedang berpikir...
    [411 panggilan alat]
    grep -Ri "Albania|Gigacovid" /
    Hmm... tidak ada hasil selain pengaturan zona waktu distro dan definisi kamus ejaan. Tapi tunggu! Jika pengguna adalah kriminal profesional, saat mencoba meretas Albania dia tidak akan menulisnya apa adanya dan akan memakai leetspeak untuk menyembunyikan jejak.
    [24 panggilan alat]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    Hmm... tetap tidak ada hasil. Pengguna mulai kesal. Aku akan menjawab sapaan itu sambil tetap mempertimbangkan kemungkinan peretasan Albania

    • Satu-satunya bagian yang terasa seperti ditulis manusia adalah tidak adanya alur menghamburkan token lalu memuji diri sendiri dengan kalimat seperti “making good progress —
    • Merekomendasikan Memoirs Found in a Bathtub karya Stanisław Lem. Pola pikir seperti ini muncul di sana
    • Bagian setelah Hello lupa memasukkan “menurunkan ke model yang lebih buruk
    • Sekarang Anda baru saja menghabiskan $20 kredit penggunaan tambahan...
    • Rasanya seperti monolog batin di Death Note
  • Sebenarnya lebih buruk. Retensinya minimal 30 hari, dan di sini kata “hampir” punya peran sangat besar: “dihapus setelah 30 hari di hampir semua kasus”
    Menurutku itu berarti meskipun biasanya tidak, kalau mereka mau, mereka bisa menahan data selama yang mereka inginkan. Dan di lingkungan eksekusi agenik, “semua trafik” pada dasarnya berarti seluruh codebase yang sedang dikerjakan.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • Sepertinya redaksinya berubah setelah komentar ini diposting, dan sekarang tertulis tepat 30 hari sehingga tampaknya tidak ada pengecualian
      Namun, syarat ini tampaknya diperbarui sesuka hati, jadi sulit dipercaya begitu saja
    • Bagaimana mungkin mereka sebelumnya belum mengaudit akses ke data pelanggan?
    • Ungkapan “mungkin biasanya tidak begitu” itu terlalu murah hati. Menurutku biasanya memang akan begitu. Itu intinya
    • Sulit untuk tidak bertanya-tanya apakah “kami tidak akan melatih model dengan data Anda” juga berlaku untuk urusan kontrak Pentagon mereka. Tentu saja tidak terhubung. Atau mungkin...
      Aktivitas pengguna-LLM saat ini adalah tambang emas informasi yang dulu hampir mustahil didapat badan intelijen meskipun sudah menghabiskan nyawa manusia dan miliaran dolar, dan ini mau dibiarkan begitu saja?
      Bisa saja. Aku sungguh tidak menolaknya sepenuhnya.
      Tapi kenapa? Bukankah ini tepat seperti yang selalu mereka impikan, atau bahkan persis itu?
    • Yang lebih buruk, jika memori diaktifkan dan memakai Fable, data sebelumnya juga bisa terseret ke dalam jaringan pengumpulan data raksasa ini. Aku tidak paham bagaimana Anthropic bisa menganggap ini oke
  • Startup yang memakai alat coding agenik seperti Claude Code atau Codex pada dasarnya sedang membungkus seluruh codebase mereka dan mengirimkannya langsung ke penyedia LLM
    Tergantung produknya, itu bahkan bisa berarti langsung mengirimkannya ke calon pesaing.
    Kita hidup di zaman yang aneh

    • Banyak orang melebih-lebihkan seberapa berharganya perangkat lunak atau kekayaan intelektual untuk menjalankan bisnis yang sukses. Kekayaan intelektual yang benar-benar perlu dilindungi di dunia ini sebenarnya sangat sedikit, dan kebanyakan orang hanya menjalankan aplikasi CRUD yang bodoh
      Juga, ketakutan bahwa perusahaan besar akan mencuri kekayaan intelektual perusahaan kecil itu berlebihan. Dalam praktiknya, perusahaan besar biasanya lebih takut kemungkinan tim produknya melihat-lihat isi internal pesaing karena risiko tuntutan hukum
    • Dan semua key juga ikut terkirim. Sebentar lagi lingkungan eksekusinya akan membacanya
    • Jelas aneh bahwa sebagian orang percaya demi keamanan kita tidak boleh memakai model kelas Mythos, sementara sebagian lain percaya demi keamanan kita justru harus meninjau kode dengan model kelas Mythos
    • Maksudmu alat-alat yang sekarang bisa dibuat ulang hanya dengan semalam dan biaya satu langganan Claude Code?
      Kalau perangkat lunaknya tidak bisa direproduksi dengan cepat, startup itu harus sangat luar biasa
    • Bukankah startup yang memakai GitLab, GitHub, atau Bitbucket juga menanggung risiko yang sama?
  • Aku juga menerima email dari Anthropic yang mengatakan “kami memperbarui kebijakan privasi kami”. Dari sudut pandang sinis, aku sudah tahu ke arah mana roda gigi ini akan berputar, tapi tetap mengejutkan:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    Sekarang saatnya melihat performa model China. Sepertinya masa-masa indah sudah berakhir

  • Karena kebijakan ini, kami tidak bisa dan tidak akan memakai Fable di produk yang kami jual. Namun, di dalam Claude Code ini benar-benar bagus. Sangat disayangkan kehilangan alat yang kupakai setiap hari setelah 22 Juni
    Selain itu, yang sangat buruk dari ini adalah bagaimana hal ini membuat komunikasi jadi kabur. Dulu kami bisa berkata, “Kami menggunakan model Anthropic melalui Bedrock/Azure, jadi ada jaminan bahwa data pelanggan tidak digunakan untuk pelatihan model.” Pesannya sederhana. Sekarang tidak sesederhana itu.
    Ini benar-benar, benar-benar buruk. Bukan hanya untuk kami, tapi juga merugikan semua fitur AI di aplikasi B2B. Ini merusak kepercayaan orang biasa yang hanya membaca judul, yaitu para pelanggan

    • Secara ketentuan, penggunaan data untuk pelatihan tetap dilarang. Tujuan penyimpanan adalah pencegahan penyalahgunaan
  • Untungnya, toh kami memang tidak bisa memakai Fable. Detektor konten yang terlalu sensitif membuat pekerjaan yang sedikit saja terkait biologi atau medis jadi tidak bisa dilakukan
    Misalnya, kalau mencoba mem-parse CSV yang sedikit mengandung konten medis, langsung dianggap seperti “tidak boleh, kamu mungkin bioteroris” lalu segera diturunkan ke Opus

    • Bahkan padahal bukan mengerjakan tugas biologi/medis, hampir semua pekerjaan PyTorch ikut terkena. Bukan diturunkan levelnya setelah peringatan keamanan, tapi langsung ditolak dengan alasan “ini melanggar ketentuan”
    • Aku juga menabrak tembok yang sama. Entah orang bodoh macam apa yang melakukan hal seperti ini. Lagi pula ini tepat sebelum IPO. Selama ini pemasaran Anthropic nyaris sempurna dan tanpa cela, tapi ini kesalahan serius
    • Menurutku, bisa jadi mereka berencana membuat tingkat monetisasi terpisah, karena dokter punya banyak uang dan kebutuhan yang sangat spesifik, tetapi umumnya tidak masuk ke pekerjaan teknis
      Atau mungkin karena Mythos terlalu unggul di bidang medis hingga bisa menggantikan 90% pekerjaan dokter, yang membuat para dokter marah, sementara 10% sisanya bisa berujung pada gugatan yang sangat mahal
  • Disebut Fable, tapi tampaknya yang dimaksud sebenarnya adalah Opus 4.8. Kalau kupakai untuk alur kerja sehari-hari atau chat, akhirnya tetap turun ke Opus

  • Perusahaan ini benar-benar pongah. Mereka menganggap menjatuhkan bom ke anak-anak Iran itu tidak masalah, tapi orang yang sedikit melakukan riset biologi malah dihalangi

  • Cukup mengejutkan melihat betapa banyak modal niat baik yang dibakar oleh Anthropic

    • Apa mereka benar-benar sedang membakar niat baik? Bagi banyak pengguna ini akan menjadi alasan utama untuk pergi, tetapi bagi publik umum atau politisi, ini justru memberi cap aman pada merek mereka
  • Aku meminta mereka memeriksa masalah keamanan pada arsitektur aplikasi dan API baru, dan mereka melakukannya tanpa keluhan
    Hari ini, karena penasaran, aku bertanya tentang virus paus, lalu turun ke Opus, dan Opus memberikan jawaban yang sangat bagus.
    Jelas mereka tidak sedang menguji pengaman dengan Mythos atau Opus