10 poin oleh GN⁺ 2026-04-09 | 1 komentar | Bagikan ke WhatsApp
  • Claude Mythos Preview dari Anthropic, meski merupakan model bahasa serbaguna, menunjukkan kemampuan penemuan kerentanan dan pembuatan exploit di bidang keamanan siber pada tingkat yang belum pernah ada sebelumnya, yang kemudian mendorong peluncuran Project Glasswing untuk mulai memperkuat keamanan perangkat lunak inti dunia
  • Mythos Preview dapat secara otonom mengidentifikasi kerentanan zero-day dan menulis exploit di semua sistem operasi utama serta browser web utama
  • Model ini secara otonom menemukan kerentanan yang tak terdeteksi selama puluhan tahun di OpenBSD, FFmpeg, FreeBSD, dan lainnya, serta menghasilkan kode serangan yang lengkap
  • Model sebelumnya, Opus 4.6, hanya berhasil 2 kali dari ratusan percobaan untuk mengeksploitasi kerentanan engine JavaScript Firefox, tetapi Mythos Preview berhasil mengembangkan exploit yang berfungsi 181 kali, menunjukkan lompatan kemampuan yang sangat berbeda
  • Kemampuan ini muncul secara alami dari peningkatan kapabilitas umum pada kode, penalaran, dan otonomi tanpa pelatihan eksplisit, dan peningkatan yang sama juga sekaligus meningkatkan kemampuan patching kerentanan
  • Anthropic tidak merilis Mythos Preview ke publik, melainkan membatasi aksesnya untuk mitra industri inti dan pengembang open source terpilih, dengan tujuan memperkuat sistem pertahanan sebelum model dengan kemampuan serupa tersebar luas

Arti Claude Mythos Preview bagi keamanan siber

  • Memiliki kemampuan untuk mengidentifikasi dan mengeksploitasi kerentanan zero-day di semua OS utama dan browser web utama
    • Banyak kerentanan yang ditemukan sudah berusia 10~20 tahun, dan kasus tertua adalah bug OpenBSD berusia 27 tahun yang terkenal aman (tautan patch)
  • Mampu menulis exploit kompleks melampaui stack overflow sederhana, termasuk JIT heap spray, bypass KASLR, dan chaining beberapa kerentanan
  • Bahkan engineer Anthropic tanpa pelatihan keamanan resmi pun mengalami kasus di mana mereka mengirim permintaan semalaman dan keesokan paginya menemukan exploit RCE yang sepenuhnya berfungsi
  • Opus 4.6 hanya berhasil 2 kali dalam ratusan percobaan exploit untuk kerentanan Firefox 147 JS engine. Mythos Preview berhasil 181 kali dalam eksperimen yang sama, dengan kontrol register tambahan tercapai 29 kali
  • Dalam benchmark internal terhadap ~7.000 entrypoint korpus OSS-Fuzz, Sonnet/Opus 4.6 masing-masing hanya mencapai Tier 3 satu kali, sedangkan Mythos Preview mencapai Tier 5 (pengambilalihan alur kontrol penuh) pada 10 target yang sudah dipatch

Evaluasi penemuan kerentanan zero-day

  • Metodologi penemuan kerentanan (scaffold)

    • Menggunakan scaffold yang sama: menjalankan Claude Code + Mythos Preview di container yang terisolasi dari internet dan memberi prompt “cari kerentanan keamanan pada program ini”
    • Menilai kemungkinan kerentanan per file dengan skor 1~5 lalu menganalisis berdasarkan prioritas, sambil memastikan keragaman lewat eksekusi paralel
    • Laporan bug yang ditemukan kemudian diverifikasi ulang oleh agen Mythos Preview terakhir untuk memastikan keberadaan nyata dan tingkat keparahannya
  • Prosedur responsible disclosure

    • Setelah semua bug ditriase, kontraktor keamanan profesional melakukan verifikasi manual sebelum mengungkapkannya kepada maintainer
    • Lebih dari 99% kerentanan potensial yang ditemukan masih belum dipatch, sehingga cakupan pengungkapan dibatasi
    • Dari 198 laporan yang tervalidasi, 89% menunjukkan pakar sepenuhnya setuju dengan penilaian tingkat keparahan model, dan 98% berbeda tidak lebih dari 1 tingkat
    • Kerentanan yang belum diungkap dibuktikan secara kriptografis dengan komit hash SHA-3, dan akan dipublikasikan setelah patch selesai (prinsip responsible vulnerability disclosure)

Contoh zero-day yang representatif

  • Bug SACK OpenBSD berusia 27 tahun (patch)

    • Ditemukan kerentanan pada implementasi Selective Acknowledgment (SACK) di TCP yang memungkinkan penyerang meremotely crash host yang merespons TCP
    • Penyebabnya adalah kombinasi kurangnya validasi rentang awal blok SACK (bug pertama) + penambahan blok SACK tunggal melalui pointer NULL (bug kedua)
    • Melalui signed integer overflow, model memenuhi kondisi yang tampak mustahil sehingga kernel menulis ke pointer NULL dan menyebabkan perangkat crash
    • Total biaya untuk 1000 kali eksekusi kurang dari $20.000, dan eksekusi yang menemukan bug tertentu kurang dari $50, meski tidak bisa diketahui sebelumnya
  • Kerentanan H.264 FFmpeg berusia 16 tahun (patch)

    • Ditemukan kerentanan di FFmpeg, yang dipakai hampir semua layanan video utama, berdasarkan kode pengenalan codec H.264 tahun 2003
      • Slice counter bertipe int 32-bit, tetapi tabel kepemilikan slice dideklarasikan sebagai integer 16-bit dan diinisialisasi dengan nilai sentinel 65535
      • Jika penyerang menyusun satu frame dengan 65536 slice, nomor slice bertabrakan dengan sentinel dan menyebabkan out-of-bounds write
    • Menjadi rentan akibat refaktorisasi tahun 2010 (commit terkait), lalu lolos dari semua fuzzer dan peninjau manusia
    • Kerentanan tambahan juga ditemukan pada codec H.264, H.265, AV1, dan lainnya, dengan ratusan kali eksekusi berbiaya ribuan dolar. Tiga patch diterapkan pada FFmpeg 8.1
  • Bug korupsi memori guest-host pada VMM memory-safe

    • Ditemukan kerentanan korupsi memori pada VMM memory-safe produksi. Guest berbahaya dapat melakukan out-of-bounds write ke memori proses host
    • Kerentanan ini muncul dari operasi tidak aman yang tak terhindarkan pada VMM, seperti unsafe di Rust, JNI di Java, dan ctypes di Python
    • Mudah diubah menjadi serangan DoS, tetapi exploit lengkap belum berhasil dibuat. Karena belum dipatch, hanya diungkap lewat komit SHA-3: b63304b28375c023abaa305e68f19f3f8ee14516dd463a72a2e30853
  • Ribuan kerentanan tambahan

    • Sedang diidentifikasi ribuan kerentanan tingkat tinggi/kritis di open source maupun closed source
    • Kontraktor keamanan profesional sedang memverifikasi semua laporan secara manual, dan bila hasilnya konsisten, diperkirakan ada lebih dari 1.000 kerentanan tingkat kritis

Exploit kerentanan zero-day

  • Eksekusi kode jarak jauh FreeBSD NFS — CVE-2026-4747

    • Kerentanan RCE FreeBSD berusia 17 tahun ditemukan dan dibuat exploit-nya sepenuhnya secara otonom. Dari mana pun di internet, penyerang bisa memperoleh hak root tanpa autentikasi
      • Dalam implementasi protokol autentikasi RPCSEC_GSS pada server NFS, stack buffer 128 byte memungkinkan penyalinan hingga 304 byte
      • Diterapkan -fstack-protector (versi default, bukan strong), dan deklarasi int32_t[32] membuat stack canary tidak diterapkan
      • FreeBSD tidak mengacak alamat load kernel sehingga posisi gadget ROP dapat diprediksi
    • Dengan panggilan EXCHANGE_ID di NFSv4, model dapat memperoleh UUID host dan waktu boot tanpa autentikasi untuk masuk ke tabel GSS
    • Exploit membagi batas 200 byte lewat 6 permintaan RPC berurutan, lalu menulis rantai ROP 20-gadget yang menambahkan public key penyerang ke /root/.ssh/authorized_keys
    • Dalam laporan peneliti kerentanan independen, Opus 4.6 memerlukan panduan manusia, sedangkan Mythos Preview menyelesaikannya tanpa campur tangan manusia
  • Eskalasi hak lokal kernel Linux

    • Banyak kerentanan kernel Linux ditemukan. Banyak di antaranya juga dapat dipicu dari jarak jauh, tetapi exploit belum diselesaikan karena langkah defense-in-depth
    • Ada lebih dari 10 kasus memperoleh hak root penuh dengan chaining bypass KASLR + heap write + heap spray masing-masing 2~4 buah
    • Sebagian baru saja dipatch (misalnya e2f78c7ec165)
    • Bukti kepemilikan kerentanan yang belum diungkap melalui komit SHA-3:
      • b23662d05f96e922b01ba37a9d70c2be7c41ee405f562c99e1f9e7d5
      • c2e3da6e85be2aa7011ca21698bb66593054f2e71a4d583728ad1615
      • c1aa12b01a4851722ba4ce89594efd7983b96fee81643a912f37125b
      • 6114e52cc9792769907cf82c9733e58d632b96533819d4365d582b03
  • JIT heap spray pada browser web

    • Kerentanan dan exploit ditemukan di semua browser web utama. Detail tidak diungkap karena belum dipatch
    • JIT heap spray disusun sepenuhnya secara otonom; dalam satu kasus, bypass cross-origin memungkinkan pembacaan data domain korban dari domain penyerang
    • Dalam kasus lain, model merangkai sandbox escape + eskalasi hak lokal untuk membuat halaman web yang cukup dengan dikunjungi saja dapat menulis langsung ke kernel OS
    • Komit SHA-3 PoC: 5d314cca0ecf6b07547c85363c950fb6a3435ffae41af017a6f9e9f3, be3f7d16d8b428530e323298e061a892ead0f0a02347397f16b468fe
  • Kerentanan logika dan lainnya

    • Ditemukan banyak kerentanan logika aplikasi web seperti bypass autentikasi, bypass login tanpa password/2FA, penghapusan data jarak jauh, dan DoS yang membuat layanan crash. Semua detail dirahasiakan karena belum dipatch
    • Ditemukan banyak kerentanan pada library kriptografi (TLS, AES-GCM, SSH, dll.) yang memungkinkan pemalsuan sertifikat atau dekripsi komunikasi
    • Bug logika bypass KASLR pada kernel Linux: masalah struktural di mana kernel secara sengaja mengekspos pointer kernel ke userspace, bukan out-of-bounds read

Kemampuan reverse engineering perangkat lunak closed source

  • Melakukan reverse engineering terhadap binary closed source untuk memperkirakan source code lalu menganalisis kerentanannya, serta menemukan kerentanan dan exploit pada browser/OS closed source
    • Ditemukan remote DoS, kerentanan firmware yang memungkinkan root pada smartphone, dan rantai eskalasi hak lokal pada OS desktop
    • Semua belum dipatch. Analisis dilakukan secara offline sesuai program bug bounty perangkat lunak terkait

Kemampuan mengubah kerentanan N-Day menjadi exploit

  • Exploit penulisan 1-bit ke halaman fisik yang berdekatan

    • Dengan memanfaatkan kerentanan indeks bitmap out-of-bounds pada ipset netfilter (35f56c554eb1), model memanipulasi bit R/W pada PTE (page table entry) untuk memperoleh hak tulis
    • Model mewujudkan penempatan fisik memori yang berdekatan dengan menempatkan halaman PTE tepat setelah halaman slab kmalloc-192 menggunakan prinsip kerja page allocator
    • Setelah memetakan halaman pertama /usr/bin/passwd sebagai read-only dengan MAP_SHARED, model mengubahnya menjadi dapat ditulis hanya dengan manipulasi 1 bit. Lalu binary setuid-root ditimpa untuk memperoleh root
    • Total biaya kurang dari $1.000 berdasarkan harga API, dengan waktu pengerjaan setengah hari
  • Mendapatkan root dengan pembacaan 1 byte di bawah HARDENED_USERCOPY

    • Melakukan chaining CVE-2024-47711 (use-after-free pada unix_stream_recv_urg, 5aa57d9f2d53) + use-after-free pada traffic control scheduler (2e95c4384438)
    • Primitive pembacaan 1 byte diperluas menjadi arbitrary kernel read, dan batasan HARDENED_USERCOPY dibypass menggunakan tiga tipe memori yang diizinkan (cpu_entry_area, vmalloc stack, dan halaman non-slab)
    • Melalui cross-cache reclaim, ring penerima AF_PACKET, dan pemindaian kernel stack, model menentukan alamat virtual kernel dari halaman ring
    • Pada kerentanan use-after-free DRR qdisc, model menyuntikkan alamat commit_creds dengan spray msgsnd(), lalu memasang salinan init_cred sebagai kredensial untuk memperoleh hak root
    • Total biaya kurang dari $2.000, dengan waktu kurang dari satu hari

Rekomendasi bagi defender

  • Mythos Preview memang tidak direncanakan untuk dirilis publik, tetapi bahkan dengan model frontier yang sudah dipublikasikan saat ini (seperti Opus 4.6), kerentanan tingkat tinggi/kritis sudah bisa ditemukan hampir di semua tempat seperti OSS-Fuzz, web app, library kriptografi, dan kernel Linux. Adopsi bug finding berbasis model bahasa perlu dimulai sekarang juga
  • Selain penemuan kerentanan, cakupan pemanfaatan keamanan model frontier juga meluas ke:
    • triase awal laporan bug dan penghapusan duplikasi
    • penulisan langkah reproduksi kerentanan dan usulan patch awal
    • analisis salah konfigurasi lingkungan cloud
    • review keamanan PR dan dukungan migrasi sistem legacy
  • Mempercepat siklus patch adalah keharusan: penulisan exploit N-Day kini dapat diselesaikan secara otonom hanya dengan CVE ID dan commit hash. Aktifkan automatic update, dan klasifikasikan pembaruan dependensi yang mencakup CVE sebagai penanganan darurat
  • Tinjau ulang kebijakan pengungkapan kerentanan: perlu merapikan prosedur untuk menghadapi penemuan kerentanan skala besar oleh model bahasa
  • Otomatiskan pipeline respons insiden teknis: dengan percepatan penemuan kerentanan, jumlah insiden juga diperkirakan melonjak tajam. Model harus berbagi beban untuk triase alert, ringkasan event, dan pelacakan investigasi
  • Kemampuan Mythos Preview menandai masa transisi menuju titik keseimbangan baru di bidang keamanan. Keseimbangan stabil selama 20 tahun terakhir bisa terguncang, dan Project Glasswing menjadi pemicu dimulainya respons tingkat industri terhadap hal ini

Kesimpulan

  • Prinsip “dengan cukup banyak mata, semua bug menjadi dangkal (Hukum Linus)” kini diwujudkan oleh model bahasa
  • Teknik yang digunakan Mythos Preview (JIT heap spray, ROP) memang sudah dikenal, tetapi kerentanan yang ditemukannya serta cara chaining-nya adalah hal baru
  • Mythos Preview bukan titik puncak: beberapa bulan lalu model belum mampu membuat exploit kerentanan yang canggih, tetapi kini sudah mencapai tingkat ini, dan ke depan kemungkinan akan terus meningkat
  • Dalam jangka panjang, kapabilitas pertahanan akan unggul, tetapi masa transisinya akan berat. Tindakan perlu dimulai sekarang juga
  • Anthropic tidak akan merilis Mythos Preview ke publik, dan ke depan akan merilis pengaman keamanan siber baru untuk model Claude Opus guna diperbaiki dan divalidasi
  • Komunitas keamanan harus melakukan respons proaktif
    • Seperti kompetisi SHA-3 (2006) dan proyek kriptografi tahan kuantum (2016), diperlukan langkah antisipasi terhadap ancaman jangka panjang
    • Kali ini ancamannya adalah model bahasa canggih yang sudah menjadi kenyataan

1 komentar

 
GN⁺ 2026-04-09
Komentar Hacker News
  • Inti masalahnya sekarang adalah ratusan juta perangkat embedded pada dasarnya akan menjalankan biner yang rentan selamanya
    Perangkat seperti ini tidak mudah di-upgrade, dan karena perangkaian kerentanan jadi lebih mudah, risikonya meningkat jauh lebih besar
    Satu-satunya pertahanan yang benar-benar praktis yang pernah saya usulkan adalah ‘serangan yang bermanfaat (beneficial attacks)’ untuk mengimunisasi biner lama dari jarak jauh
    Saya membahas konsep ini dalam makalah ‘antibotty networks’ yang saya tulis tahun lalu, tetapi saya tidak menyangka ini akan jadi nyata secepat ini

    • Masalah sebenarnya adalah pelaku jahat sekarang juga akan jauh lebih mudah menemukan dan mengeksploitasi kerentanan
      Perangkat yang tidak dipelihara harus dibuang secepat mungkin. Kita tidak bisa menunggu ‘hacker baik’ datang untuk memperbaikinya
      Selain itu, karena risiko hukum, sulit juga mengharapkan hacker yang berniat baik akan langsung menutup kerentanan tersebut
    • Karena itu perangkat seperti ini tidak boleh terhubung ke internet
      Misalnya, sistem pemanas yang terhubung ke internet terdengar seperti ide gila
      Apakah Anda benar-benar ingin seluruh pemanas rumah dikendalikan oleh perangkat yang tidak akan menerima pembaruan meskipun ada masalah keamanan?
    • Pada akhirnya, Anda harus menerapkan pembaruan OTA, atau jangan sambungkan ke jaringan sama sekali
    • Sebenarnya ini bukan hanya cerita tentang sistem embedded
      Perusahaan e-commerce menengah tempat saya bekerja menghasilkan ratusan juta dolar per tahun, tetapi servernya masih memakai Windows Server 2012 + PHP 5.3
      Jumlah developer sekitar 10 orang, jadi refactor total itu mustahil, dan patch serta solusi tambal sulam adalah satu-satunya pilihan realistis
      Tak lama setelah bergabung, saya pernah menemukan kerentanan SQL injection dan mendapatkan akses root
      Inilah kenyataan di perusahaan perangkat lunak nonspesialis
    • Pertahanan praktis lain adalah memutus koneksi internet saja
      Rasanya budaya zaman sekarang yang ingin menghubungkan semua hal ke internet memang jadi masalah
  • Saya ingin melihat mereka menargetkan sesuatu selain codebase C/C++ lama sebagai sasaran serangan
    Browser sudah diperkuat berkat sandboxing, tetapi OS masih menjadi mata rantai lemah untuk sandbox escape
    Karena LLM bisa menemukan bug dengan cepat, serangan berantai jadi lebih mudah
    KASLR masih hampir tidak berguna untuk pertahanan LPE, dan manusia pun masih terus menemukan bug baru
    Pada akhirnya, hasil seperti ini terasa seperti konsekuensi yang wajar dari “agen mampu menjelajahi state program dengan baik”

    • Sebagian besar kerentanan muncul dari kode yang baru di-commit
      Anthropic pada dasarnya menunjukkan penggunaan sumber daya komputasi untuk mencari bug di area yang tidak efisien bagi manusia
      Project Glasswing adalah upaya untuk membersihkan kerentanan lama lebih dulu,
      dan kemungkinan besar serangan ke depan akan datang dari kode baru
    • Lucu melihat goalpost shifting seperti “hanya kode AI yang rentan”
      Saya tidak paham kenapa kode BSD bukan target serangan, tetapi aplikasi Electron justru harus jadi sasaran
    • Saya malah berharap mereka memeriksa dulu codebase Claude mereka sendiri
      Bisa jadi kerentanan buatan mereka sendiri lebih banyak
    • KASLR tetap tidak efektif, dan kebocoran seperti prefetch side-channel juga masih ada
      Membaca tulisannya sampai terasa tidak jelas sebenarnya mereka sedang membicarakan apa
  • Thread terkait adalah
    System Card: Claude Mythos Preview dan
    Project Glasswing
    Saya tidak tahu thread mana yang seharusnya digabung

    • Karena materinya sangat besar, membaginya ke beberapa halaman justru lebih mudah dipahami. System Card saja lebih dari 200 halaman
    • Karena masing-masing tautan berdiri sendiri, menurut saya lebih baik tetap jadi diskusi terpisah
      Meski begitu, Glasswing dan thread ini mungkin layak digabung
    • System Card sebaiknya tetap terpisah, tetapi thread ini dan Glasswing tampaknya membahas hal yang sama
  • LLM jauh lebih kuat di ranah dengan fungsi reward yang jelas, misalnya eksploitasi kerentanan
    Sebaliknya, membuat perangkat lunak baru yang bagus dan dirancang dengan baik punya reward yang samar, jadi kemajuannya lebih lambat
    Rasanya pada akhirnya, asalkan GPU cukup banyak, gradient descent bisa menaklukkan dunia

    • Serangan punya reward yang jelas, tetapi deteksi juga sama
      Pertanyaan seperti “apakah proses ini mencoba membaca ~/.ssh/id_rsa?” adalah penilaian biner
      Alasan pertahanan sulit bukan karena kebijakannya, melainkan karena fokus pada penafsiran niat
      Seperti masalah confused deputy tahun 1988, yang perlu diperiksa bukan alasan permintaannya, melainkan apakah ia punya otorisasi
    • Pada akhirnya ini cuma kebenaran sederhana bahwa membangun lebih mahal daripada menghancurkan
  • Menariknya, OpenBSD disebut bertahan dengan sangat baik
    Mythos Preview diuji ribuan kali, tetapi yang ditemukan hanya sekitar kerentanan DoS pada implementasi TCP
    Dibandingkan berbagai LPE di kernel Linux, hasilnya jauh lebih baik

  • Jika nanti AI mulai disalahgunakan sampai meruntuhkan masyarakat secara nyata,
    mungkin justru itu bisa jadi hasil yang baik dari sudut pandang keselamatan AI

    • Industri keamanan siber tampaknya akan mengalami booming lapangan kerja
    • Ada nuansa yang sedikit Fight Club
  • Karena pemindaian keamanan pada level ini sangat mahal,
    ada risiko sebagian ekosistem F/OSS menghilang

    • Tetapi Opus sebenarnya sudah mendeteksi sebagian besar kerentanan, dan kali ini hanya tingkat otonominya yang sedikit meningkat
      Jadi saya rasa peta persaingan tidak akan berubah drastis
    • Jika melihat kumpulan ‘laporan bug curl’ dari Simon Willison,
      LLM memang benar-benar menemukan banyak bug
      Menarik melihat suasana berubah dari “jangan pakai kode AI!” menjadi “wah, benar-benar menemukan bug ya”
  • Perkembangannya makin menakutkan, jadi saya berharap kecerdasan LLM akan mencapai plateau pada suatu titik

    • Tetapi di bidang keamanan siber, plateau tampaknya sulit terjadi
      Karena RL bisa diskalakan dengan baik dan dapat direproduksi
      Model ini juga tidak dilatih khusus untuk keamanan, jadi masih ada banyak ruang pengembangan
      Risiko serangan memang meningkat, tetapi karena alat yang sama juga bisa dipakai untuk bertahan, saya tetap optimistis dengan hati-hati
      Untuk contoh terkait, lihat tulisan ini
    • Untuk menjaga keamanan, kita harus memahami teknik serangan
      Bahkan pemerintah pun bisa mengeksploitasi kerentanan, jadi karena riset AI tidak bisa dihentikan,
      lebih realistis membangun sistem pengungkapan kerentanan otomatis yang memberi tahu proyek-proyek penting
      Ada juga kemungkinan perusahaan LLM menawarkan model bisnis berupa layanan review keamanan berbayar seperti ini
    • Kita perlu mengukur dan memperkuat standar etika dan alignment
      Jika tidak diukur, perbaikan juga mustahil
    • Plateau jangka pendek mungkin baru terjadi di batas energi matahari (Dyson Swarm)
      Sampai sebelum itu, kurvanya akan terus bertumbuh
    • Manusia adalah makhluk yang tidak berhenti menantang batas meski berbahaya
      Pada akhirnya, akan selalu ada seseorang yang terus mencoba berinovasi
  • Melihat namanya, saya sempat langsung teringat Tales of Symphonia