- Menjelang dengar pendapat AI di Senat AS, Anthropic mengklaim aktivitas terkait Alibaba merupakan yang terbesar di antara serangan sejenis yang menargetkan perusahaan tersebut
- Metode utamanya adalah distillation yaitu melatih model yang lebih lemah dengan keluaran dari model yang lebih kuat, dan Anthropic menilai China bisa lebih cepat mencapai kapabilitas setingkat Mythos Preview
- Dari 22 April 2026 hingga 5 Juni, tercatat lebih dari 28,8 juta interaksi dengan Claude, dan jumlah akun penipuan disebut hampir 25 ribu
- Anthropic mengklaim pelaku operasinya terhubung dengan Alibaba dan laboratorium AI Alibaba Qwen, sementara Alibaba tidak segera menanggapi permintaan komentar Reuters
- Anthropic mendukung berbagi intelijen ancaman dan respons bersama antara pemerintah AS dan perusahaan AI swasta, tetapi pada periode yang sama akses ke model Mythos dan Fable miliknya juga dibatasi
Dugaan ekstraksi ilegal terkait Alibaba
- Anthropic mengklaim dalam surat kepada Senat AS bahwa perusahaan teknologi dan e-commerce asal China Alibaba telah mengekstraksi kapabilitas model AI Claude secara ilegal
- Menurut surat yang dilihat Reuters, Anthropic menilai aktivitas ini sebagai yang terbesar di antara serangan sejenis yang pernah mereka identifikasi
- Alibaba tidak segera menanggapi permintaan komentar Reuters
Metode distillation dan skala serangan
- Anthropic menyebut aktivitas tersebut sebagai upaya distillation
- Distillation adalah metode melatih model yang relatif lebih lemah menggunakan keluaran dari model yang lebih kuat
- Periode kampanye adalah 22 April 2026–5 Juni
- Dalam periode ini, interaksi yang menargetkan Claude dihitung lebih dari 28,8 juta
- Akun penipuan yang digunakan hampir 25 ribu
- Anthropic menilai distillation adalah cara untuk mempercepat China mencapai kapabilitas canggih Mythos Preview milik Anthropic
Klaim keterkaitan dengan Alibaba Qwen dan penerima surat
- Anthropic mengklaim kampanye ini dijalankan oleh operator yang terhubung dengan Alibaba dan laboratorium AI milik Alibaba, Alibaba Qwen
- Tanggal surat tersebut adalah 10 Juni
- Penerimanya adalah ketua dan anggota senior Komite Perbankan Senat AS, Tim Scott dan Elizabeth Warren
- Surat ini dikirim menjelang dengar pendapat AI yang telah dijadwalkan
Kasus sebelumnya yang melibatkan laboratorium AI China
- Anthropic juga pernah menyatakan bahwa pada Februari 2026 mereka mengidentifikasi kampanye oleh startup AI China DeepSeek dan dua laboratorium AI China lainnya yang berupaya mengekstraksi kapabilitas secara ilegal dari platform Claude AI
- Skala yang disampaikan Anthropic saat itu adalah sebagai berikut
- DeepSeek: lebih dari 150 ribu interaksi
- Moonshot AI: lebih dari 3,4 juta
- MiniMax: lebih dari 13 juta
- Anthropic menyatakan saat itu bahwa intensitas dan kecanggihan kampanye semacam ini terus meningkat, sehingga diperlukan respons cepat dan terkoordinasi dari industri, pembuat kebijakan, dan komunitas AI global
Langkah pemerintah AS dan pembatasan model Anthropic
- Anthropic menyatakan mendukung upaya respons pemerintah AS
- Termasuk berbagi intelijen ancaman dengan perusahaan AI swasta
- Serta aktivitas respons bersama lainnya
- Pada April 2026, Gedung Putih menuduh China mencuri kekayaan intelektual laboratorium AI AS dalam skala industri
- Alibaba pada bulan yang sama ditambahkan ke daftar perusahaan militer China milik Departemen Pertahanan AS, dan Alibaba sedang menggugat penetapan tersebut
- Departemen Perdagangan AS menahan diri untuk tidak memasukkan DeepSeek ke daftar hitam perdagangan meskipun perusahaan itu dianggap sebagai risiko keamanan nasional dalam komite gabungan pemerintah, demi menghindari meningkatnya ketegangan dengan Beijing
- Dua hari setelah Anthropic mengirim surat, pada 12 Juni, Departemen Perdagangan AS memberlakukan pembatasan pada model AI terbaru Anthropic, Mythos dan Fable
- Otoritas khawatir model-model ini dapat diterapkan kepada pengguna intelijen militer di China dan negara-negara lain yang menjadi perhatian
- Akibat pembatasan ini, Anthropic menonaktifkan akses ke model tersebut secara global
1 komentar
Komentar Hacker News
Tinggal taruh ini di sini lalu pergi: “Seorang hakim memutuskan bahwa pengunduhan lebih dari 7 juta buku oleh Anthropic dari situs bajakan seperti LibGen merupakan pelanggaran, dan pembelaan Anthropic atas dasar ‘tujuan riset’ juga ditolak: ‘Anda tidak bisa memberkati diri sendiri dengan mengatakan punya tujuan riset lalu mengambil buku teks apa pun yang Anda mau.’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
Pada dasarnya ada dua jenis distilasi. 1) pendekatan skala besar yang bodoh, black-box, dengan melempar pertanyaan dan memakai jawabannya sebagai sinyal penguatan, 2) distilasi yang lebih terarah, di mana satu model secara langsung mengajar, melatih, dan membimbing model lain (RLAIF)
Yang kedua pada dasarnya adalah fine-tuning model dengan arahan dari model lain. Banyak perusahaan melakukan fine-tuning seperti ini setiap hari. Laboratorium riset Tiongkok juga hampir pasti memakai cara ini, karena jauh lebih efektif untuk hasil akhir daripada sekadar mengeruk jawaban sederhana atas pertanyaan sederhana
Keluhan soal distilasi ini tampaknya bertujuan membesar-besarkan masalah agar terlihat lebih serius daripada kenyataannya, dengan tujuan proteksionis mendorong pemerintah AS untuk menghalangi atau melarang penyedia model dari Tiongkok. Mereka sudah meminta pengetatan kontrol ekspor chip, yang terasa lucu mengingat DeepSeek v4 dirancang agar berjalan di chip Huawei dan perusahaan Tiongkok lain juga sedang mengikuti jejak itu. Tapi karena itu tidak bisa dikatakan secara terang-terangan, mereka malah berargumen bahwa model hasil distilasi mungkin tidak seaman model mereka, jadi kontrol ekspor perlu diperketat lagi. Padahal kalau Anda menunjukkan jailbreak yang menembus pengaman model mereka sendiri, mereka akan bilang tidak perlu khawatir soal keamanan karena model apa pun pada akhirnya bisa dijailbreak
2) mustahil membuat large language model yang kebal terhadap semua jailbreak. Lagi-lagi tidak ada bukti tepercaya untuk membantah ini, jadi Anthropic sepenuhnya benar
Jika nomor 1 salah, maka detail jailbreak itu tinggal dipublikasikan saja. Katanya hanya berfungsi di Fable 5, jadi tidak ada risiko yang mungkin timbul
Jika nomor 2 salah, maka laboratorium large language model lain seharusnya sudah berhasil melakukannya. Apalagi beberapa pemerintah sudah jelas menunjukkan bahwa ada pasar untuk proyek seperti itu
Secara mendasar, sangat sulit mencegah hal ini sambil tetap menjaga model AI tetap berguna
Ini mengingatkan pada keluhan Steve Jobs di akhir 1980-an tentang Mac GUI yang ditiru. Padahal dia sendiri tidak secara terbuka mengakui pekerjaan yang dilakukan di Xerox Alto dan sistem operasi Star
“Kamu mau meniru sesuatu yang sudah kutiru lebih dulu!”
Mirip perusahaan yang merayapi seluruh internet untuk membuat large language model raksasa lalu mengeluh karena ditiru
Informasi benar-benar ingin bebas, tetapi perusahaan AI ingin menjadi penjaga gerbang. Dalam jangka panjang, saya rasa pendekatan yang lebih berkelanjutan, yaitu bobot terbuka, akan menang
Lucu sekali melihat kemunafikan Anthropic yang mengeluh bahwa “kemampuan model AI Claude diekstraksi secara ilegal”, sambil mendukung kecaman Gedung Putih bahwa Tiongkok “mencuri kekayaan intelektual lab AI AS dalam skala industri”
Anthropic, OpenAI, Google, Microsoft, dan lainnya melatih model dengan mengumpulkan konten sebanyak-banyaknya sambil mengabaikan hak pemegang hak cipta. Sekarang salah satu dari mereka berteriak bahwa tidak adil ketika pihak lain melakukan hal yang sama seperti yang mereka semua lakukan
robots.txt, dan membuat biaya bandwidth melonjak dianggap tidak masalah. Tapi kalau praktik pengumpulan data itu menimbulkan biaya bagi penyedia AI, tiba-tiba itu dianggap jelas tak bisa diterimaYang terjadi sekarang adalah ini: reseller Tiongkok menawarkan token Claude dengan harga 70–90% lebih murah daripada harga API resmi Anthropic. Mereka mencapainya dengan menggabungkan akun Claude Max untuk dijual ulang kapasitasnya, memakai penipuan pembayaran, serta menjual ulang output model dan rantai penalaran ke berbagai lembaga riset Tiongkok. Dengan membantu akses ke model sebagai imbalan atas log pengguna dan jejak penalaran, lalu menjualnya sebagai data pelatihan, mereka bisa beroperasi di bawah biaya pokok
Claude dan ChatGPT sama-sama diblokir di Tiongkok. Untuk mengaksesnya perlu VPN, dan tidak bisa membayar dengan kartu bank Tiongkok. Karena itu, kebanyakan orang yang ingin mengakses Claude membeli akses lewat reseller. Itulah cara termudah dan termurah untuk mengakses model Anthropic di Tiongkok
Para reseller ini mengoperasikan puluhan ribu akun bot, dan inilah alasan Anthropic memperkenalkan verifikasi identitas untuk memperlambat serbuan bot
Seorang reseller token menawarkan Opus 4.8 dengan diskon 93% dari tarif API resmi: https://yunwu.ai/pricing?provider=Anthropic
Inilah salah satu alasan harga DeepSeek dan GLM bisa semurah itu. Karena harus bersaing dengan harga token yang sangat tidak masuk akal rendahnya di Tiongkok, mereka harus menjaga harga tetap rendah agar orang mau memakai produknya
Saya sudah membagikan ini beberapa bulan lalu, tapi hampir tidak mendapat tanggapan. Ini tulisan yang sangat bagus yang menjelaskan ekonomi penjualan ulang token di Tiongkok: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
Saya juga belajar bahwa kalau Anthropic ingin bersaing, mereka harus bekerja lebih baik. Kalau tidak, orang lain yang akan menang
Apa sekarang prinsip ini tidak berlaku untuk perusahaan raksasa AS
DeepSeek dan GLM berbobot terbuka, dan penyedia inferensi AS juga menjualnya jauh lebih murah. Harganya murah karena modelnya lebih efisien
Kalau tidak, ini terdengar seperti argumen umum dari kubu pesimistis AI bahwa “Anthropic/OpenAI menjual token senilai $1.000 seharga $100 dan kehilangan banyak uang”
Tindakan Alibaba dijelaskan sebagai upaya “distilasi”, yang oleh Anthropic disebut sebagai melatih model yang lebih lemah menggunakan output dari model yang lebih kuat
Claude menggunakan konten dalam skala terabita untuk melatih modelnya sendiri tanpa izin, dan itu mereka anggap tidak masalah. Sekarang ketika seseorang memakai output model Claude untuk melatih model lain, mereka berteriak bahwa itu tidak adil
Akan menarik melihat persidangan di mana Anthropic harus mengungkap asal data pelatihannya, dan menjelaskan mengapa mereka boleh menjual data pelatihan yang dimuntahkan kembali kepada pelanggan, tetapi Alibaba tidak boleh melatih modelnya sendiri dengan model Anthropic
Sepertinya akan seru
Tindakan Anthropic terlihat seperti gestur performatif. Orang lain juga sudah menebak-nebak siapa audiens yang sebenarnya dituju
Tepatnya, apa yang disebut ilegal di sini?
Secara hukum, output model tidak bisa dilindungi sebagai hak kekayaan intelektual, baik menurut hukum nasional maupun internasional. Maksimal yang bisa diharapkan adalah upaya perdata, dan itu pun sulit mengingat cara mereka sendiri melatih model secara harfiah bersifat ilegal
Anthropic diperlakukan persis seperti cara mereka memperlakukan semua orang lain. Mereka sendiri yang membuat tempat tidurnya, jadi sekarang mereka juga harus tidur di situ
Tindakan Alibaba disebut sebagai “distilasi”, yaitu melatih model yang lebih lemah dengan keluaran dari model yang lebih kuat, dan saya tidak paham apa yang salah dari itu
Anthropic mengatakan kampanye ini berlangsung dari 22 April 2026 hingga 5 Juni, dan menghasilkan lebih dari 28,8 juta interaksi dengan Claude melalui hampir 25.000 akun penipuan
Apa yang membuat akun-akun itu menjadi penipuan. Kalau mereka membayar harga yang disepakati, bukankah itu tidak masalah. Jika mereka tidak membayar, mengapa Anthropic tetap memberikan layanan
Distilasi pada dasarnya tidak bisa dicegah. Yang bisa dilakukan hanyalah memperlambatnya. Coba bantah
Pada akhirnya, perusahaan-perusahaan Tiongkok akan merilis ekstensi seperti Honey, menumpang di atas pelanggan nyata non-Tiongkok, dan pada akhirnya tetap mengirim semuanya ke Tiongkok
Sudah selesai
Namun, lab AI masih bisa terus menciptakan nilai ekonomi yang sangat besar tanpa merilis modelnya dan tanpa mengeksposnya pada potensi distilasi. Misalnya, mereka bisa memakai model itu hanya secara internal untuk mengembangkan obat
Saya berharap suatu hari nanti ada masa depan di mana pihak lain juga bisa mengakses model terdepan, tetapi jika dinilai lebih penting untuk mencegah penyebaran melalui distilasi, itu tidak mutlak diperlukan
[1]: Referensi terkait distilasi di https://dualuse.dev/posts/export-controls-on-fable
Intinya, mungkin tidak ada solusi teknis, tetapi secara teoretis bisa ada solusi politik
Makalah Berkeley “False Promise of Imitating Proprietary LLMs” juga berpendapat bahwa peniruan memang cepat memperkecil kesenjangan gaya, tetapi kesenjangan kemampuan tetap besar
https://arxiv.org/abs/2305.15717