Anthropic: “Alibaba mengekstraksi kapabilitas model AI Claude secara ilegal”

(reuters.com)

1 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp

Menjelang dengar pendapat AI di Senat AS, Anthropic mengklaim aktivitas terkait Alibaba merupakan yang terbesar di antara serangan sejenis yang menargetkan perusahaan tersebut
Metode utamanya adalah distillation yaitu melatih model yang lebih lemah dengan keluaran dari model yang lebih kuat, dan Anthropic menilai China bisa lebih cepat mencapai kapabilitas setingkat Mythos Preview
Dari 22 April 2026 hingga 5 Juni, tercatat lebih dari 28,8 juta interaksi dengan Claude, dan jumlah akun penipuan disebut hampir 25 ribu
Anthropic mengklaim pelaku operasinya terhubung dengan Alibaba dan laboratorium AI Alibaba Qwen, sementara Alibaba tidak segera menanggapi permintaan komentar Reuters
Anthropic mendukung berbagi intelijen ancaman dan respons bersama antara pemerintah AS dan perusahaan AI swasta, tetapi pada periode yang sama akses ke model Mythos dan Fable miliknya juga dibatasi

Dugaan ekstraksi ilegal terkait Alibaba

Anthropic mengklaim dalam surat kepada Senat AS bahwa perusahaan teknologi dan e-commerce asal China Alibaba telah mengekstraksi kapabilitas model AI Claude secara ilegal
Menurut surat yang dilihat Reuters, Anthropic menilai aktivitas ini sebagai yang terbesar di antara serangan sejenis yang pernah mereka identifikasi
Alibaba tidak segera menanggapi permintaan komentar Reuters

Metode distillation dan skala serangan

Anthropic menyebut aktivitas tersebut sebagai upaya distillation
- Distillation adalah metode melatih model yang relatif lebih lemah menggunakan keluaran dari model yang lebih kuat
Periode kampanye adalah 22 April 2026–5 Juni
Dalam periode ini, interaksi yang menargetkan Claude dihitung lebih dari 28,8 juta
Akun penipuan yang digunakan hampir 25 ribu
Anthropic menilai distillation adalah cara untuk mempercepat China mencapai kapabilitas canggih Mythos Preview milik Anthropic

Klaim keterkaitan dengan Alibaba Qwen dan penerima surat

Anthropic mengklaim kampanye ini dijalankan oleh operator yang terhubung dengan Alibaba dan laboratorium AI milik Alibaba, Alibaba Qwen
Tanggal surat tersebut adalah 10 Juni
Penerimanya adalah ketua dan anggota senior Komite Perbankan Senat AS, Tim Scott dan Elizabeth Warren
Surat ini dikirim menjelang dengar pendapat AI yang telah dijadwalkan

Kasus sebelumnya yang melibatkan laboratorium AI China

Anthropic juga pernah menyatakan bahwa pada Februari 2026 mereka mengidentifikasi kampanye oleh startup AI China DeepSeek dan dua laboratorium AI China lainnya yang berupaya mengekstraksi kapabilitas secara ilegal dari platform Claude AI
Skala yang disampaikan Anthropic saat itu adalah sebagai berikut
- DeepSeek: lebih dari 150 ribu interaksi
- Moonshot AI: lebih dari 3,4 juta
- MiniMax: lebih dari 13 juta
Anthropic menyatakan saat itu bahwa intensitas dan kecanggihan kampanye semacam ini terus meningkat, sehingga diperlukan respons cepat dan terkoordinasi dari industri, pembuat kebijakan, dan komunitas AI global

Langkah pemerintah AS dan pembatasan model Anthropic

Anthropic menyatakan mendukung upaya respons pemerintah AS
- Termasuk berbagi intelijen ancaman dengan perusahaan AI swasta
- Serta aktivitas respons bersama lainnya
Pada April 2026, Gedung Putih menuduh China mencuri kekayaan intelektual laboratorium AI AS dalam skala industri
Alibaba pada bulan yang sama ditambahkan ke daftar perusahaan militer China milik Departemen Pertahanan AS, dan Alibaba sedang menggugat penetapan tersebut
Departemen Perdagangan AS menahan diri untuk tidak memasukkan DeepSeek ke daftar hitam perdagangan meskipun perusahaan itu dianggap sebagai risiko keamanan nasional dalam komite gabungan pemerintah, demi menghindari meningkatnya ketegangan dengan Beijing
Dua hari setelah Anthropic mengirim surat, pada 12 Juni, Departemen Perdagangan AS memberlakukan pembatasan pada model AI terbaru Anthropic, Mythos dan Fable
- Otoritas khawatir model-model ini dapat diterapkan kepada pengguna intelijen militer di China dan negara-negara lain yang menjadi perhatian
- Akibat pembatasan ini, Anthropic menonaktifkan akses ke model tersebut secara global

1 komentar

GN⁺ 4 jam lalu

Komentar Hacker News

Tinggal taruh ini di sini lalu pergi: “Seorang hakim memutuskan bahwa pengunduhan lebih dari 7 juta buku oleh Anthropic dari situs bajakan seperti LibGen merupakan pelanggaran, dan pembelaan Anthropic atas dasar ‘tujuan riset’ juga ditolak: ‘Anda tidak bisa memberkati diri sendiri dengan mengatakan punya tujuan riset lalu mengambil buku teks apa pun yang Anda mau.’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
- Pada masa awal streaming musik, banyak pemain baru juga mengisi layanan mereka dengan pustaka konten bajakan yang sangat besar. Pemenangnya kemudian meneken kontrak dengan pemegang hak cipta dan melacak sisanya
- Bukankah lucu kalau saat ditanya lirik lagu, model-model ini tiba-tiba bisa mengingat materi berhak cipta
- Tapi bukankah mereka juga seharusnya memusnahkan model yang dilatih dengan buku-buku itu
- Seberapa banyak “kemampuan” yang mereka “ekstrak” dari buku-buku itu
- “Kamu mau menculik barang yang aku curi secara sah!”
Pada dasarnya ada dua jenis distilasi. 1) pendekatan skala besar yang bodoh, black-box, dengan melempar pertanyaan dan memakai jawabannya sebagai sinyal penguatan, 2) distilasi yang lebih terarah, di mana satu model secara langsung mengajar, melatih, dan membimbing model lain (RLAIF)
Yang kedua pada dasarnya adalah fine-tuning model dengan arahan dari model lain. Banyak perusahaan melakukan fine-tuning seperti ini setiap hari. Laboratorium riset Tiongkok juga hampir pasti memakai cara ini, karena jauh lebih efektif untuk hasil akhir daripada sekadar mengeruk jawaban sederhana atas pertanyaan sederhana
Keluhan soal distilasi ini tampaknya bertujuan membesar-besarkan masalah agar terlihat lebih serius daripada kenyataannya, dengan tujuan proteksionis mendorong pemerintah AS untuk menghalangi atau melarang penyedia model dari Tiongkok. Mereka sudah meminta pengetatan kontrol ekspor chip, yang terasa lucu mengingat DeepSeek v4 dirancang agar berjalan di chip Huawei dan perusahaan Tiongkok lain juga sedang mengikuti jejak itu. Tapi karena itu tidak bisa dikatakan secara terang-terangan, mereka malah berargumen bahwa model hasil distilasi mungkin tidak seaman model mereka, jadi kontrol ekspor perlu diperketat lagi. Padahal kalau Anda menunjukkan jailbreak yang menembus pengaman model mereka sendiri, mereka akan bilang tidak perlu khawatir soal keamanan karena model apa pun pada akhirnya bisa dijailbreak
- Bagian “keluhan soal distilasi membesar-besarkan masalah” itu benar, tetapi sayangnya artikel Reuters sendiri ikut ambil bagian dalam dramatisasi itu. Di paragraf pertama, Reuters mengulang istilah Anthropic bahwa distilasi adalah sebuah “serangan” tanpa tanda kutip, sehingga pembaca sulit menyadari bahwa frame itu adalah klaim perusahaan. Distilasi bukan serangan
- Mungkin ini pertanyaan bodoh, tapi setahu saya model-model ini dilatih dengan data skala petabyte. Jumlah tanya/jawab yang bisa diekstrak dengan mengueri model yang lebih besar (Claude) pasti cukup terbatas, jadi dibanding dataset pelatihan bukankah itu cuma setetes air
- https://research.nvidia.com/labs/lpr/slm-agents/ — data distilasi adalah produk sampingan yang secara alami muncul jika memakai model seperti ini. Tidak ada pertahanan yang efektif. Anthropic berusaha memperlambat dan menyembunyikan bagian dalam model dengan menurunkan blok pemikiran menjadi ringkasan, tetapi pada akhirnya secara matematis memang tidak ada solusi, dan pada skala konglomerat/multinasional ini bekerja cukup baik. Begitu biaya menjadi prioritas, efek penguncian untuk terus menahan pelanggan pun menghilang
- Mereka mengajukan dua klaim. 1) jailbreak publik tertentu yang ada di Fable 5 tidak berbahaya, sudah dikonfirmasi oleh banyak ahli, dan tidak ada bukti tepercaya yang menyatakan sebaliknya. Jadi kemungkinan Anthropic benar
  2) mustahil membuat large language model yang kebal terhadap semua jailbreak. Lagi-lagi tidak ada bukti tepercaya untuk membantah ini, jadi Anthropic sepenuhnya benar
  Jika nomor 1 salah, maka detail jailbreak itu tinggal dipublikasikan saja. Katanya hanya berfungsi di Fable 5, jadi tidak ada risiko yang mungkin timbul
  Jika nomor 2 salah, maka laboratorium large language model lain seharusnya sudah berhasil melakukannya. Apalagi beberapa pemerintah sudah jelas menunjukkan bahwa ada pasar untuk proyek seperti itu
- Jika Anda sedang melakukan evaluasi, pada praktiknya itu hampir sama dengan melakukan RLAIF, hanya saja modelnya tidak dilatih. Anda cuma melihat hasilnya
  Secara mendasar, sangat sulit mencegah hal ini sambil tetap menjaga model AI tetap berguna
Ini mengingatkan pada keluhan Steve Jobs di akhir 1980-an tentang Mac GUI yang ditiru. Padahal dia sendiri tidak secara terbuka mengakui pekerjaan yang dilakukan di Xerox Alto dan sistem operasi Star
“Kamu mau meniru sesuatu yang sudah kutiru lebih dulu!”
Mirip perusahaan yang merayapi seluruh internet untuk membuat large language model raksasa lalu mengeluh karena ditiru
- Mungkin yang dimaksud adalah kutipan yang sering dikaitkan dengan Bill Gates ini: “Begini, Steve, menurutku ini tidak sesederhana itu. Rasanya lebih seperti kita berdua punya tetangga kaya bernama Xerox, lalu saat aku masuk untuk mencuri TV-nya, ternyata aku mendapati kamu sudah lebih dulu mencurinya.”
- Sebelum pertemuan itu terjadi, Apple telah memberi Xerox hak untuk membeli saham pra-IPO senilai 1 juta dolar
- Ya, seluruh industri AI memang cuma kumpulan orang yang saling meniru. Ini dimulai ketika perusahaan AI melahap habis informasi yang dibagikan di internet selama 40 tahun terakhir oleh orang-orang teknis atau altruistis untuk membantu sesama manusia, lalu menelan materi bajakan dan berhak cipta, dan sekarang perusahaan AI saling meniru satu sama lain
  Informasi benar-benar ingin bebas, tetapi perusahaan AI ingin menjadi penjaga gerbang. Dalam jangka panjang, saya rasa pendekatan yang lebih berkelanjutan, yaitu bobot terbuka, akan menang
- Semua large language model menganggap Jon Skeet sebagai dewa
- “Kamu mau menculik barang yang aku curi secara sah!”
Lucu sekali melihat kemunafikan Anthropic yang mengeluh bahwa “kemampuan model AI Claude diekstraksi secara ilegal”, sambil mendukung kecaman Gedung Putih bahwa Tiongkok “mencuri kekayaan intelektual lab AI AS dalam skala industri”
Anthropic, OpenAI, Google, Microsoft, dan lainnya melatih model dengan mengumpulkan konten sebanyak-banyaknya sambil mengabaikan hak pemegang hak cipta. Sekarang salah satu dari mereka berteriak bahwa tidak adil ketika pihak lain melakukan hal yang sama seperti yang mereka semua lakukan
- Perusahaan AI tampaknya menganggap semua yang ada di internet itu gratis, kecuali milik mereka sendiri. Menghantam situs web acak dengan crawler AI, mengabaikan robots.txt, dan membuat biaya bandwidth melonjak dianggap tidak masalah. Tapi kalau praktik pengumpulan data itu menimbulkan biaya bagi penyedia AI, tiba-tiba itu dianggap jelas tak bisa diterima
- Menurut hukum yang berlaku, output Claude adalah domain publik, jadi ini bukan kasus yang benar-benar sama. Jadi pihak Tiongkok tidak mencuri apa pun di sini
- Punyamu adalah punyaku, dan punyaku tetap punyaku
- Tidak ada kehormatan di antara para pencuri
Yang terjadi sekarang adalah ini: reseller Tiongkok menawarkan token Claude dengan harga 70–90% lebih murah daripada harga API resmi Anthropic. Mereka mencapainya dengan menggabungkan akun Claude Max untuk dijual ulang kapasitasnya, memakai penipuan pembayaran, serta menjual ulang output model dan rantai penalaran ke berbagai lembaga riset Tiongkok. Dengan membantu akses ke model sebagai imbalan atas log pengguna dan jejak penalaran, lalu menjualnya sebagai data pelatihan, mereka bisa beroperasi di bawah biaya pokok
Claude dan ChatGPT sama-sama diblokir di Tiongkok. Untuk mengaksesnya perlu VPN, dan tidak bisa membayar dengan kartu bank Tiongkok. Karena itu, kebanyakan orang yang ingin mengakses Claude membeli akses lewat reseller. Itulah cara termudah dan termurah untuk mengakses model Anthropic di Tiongkok
Para reseller ini mengoperasikan puluhan ribu akun bot, dan inilah alasan Anthropic memperkenalkan verifikasi identitas untuk memperlambat serbuan bot
Seorang reseller token menawarkan Opus 4.8 dengan diskon 93% dari tarif API resmi: https://yunwu.ai/pricing?provider=Anthropic
Inilah salah satu alasan harga DeepSeek dan GLM bisa semurah itu. Karena harus bersaing dengan harga token yang sangat tidak masuk akal rendahnya di Tiongkok, mereka harus menjaga harga tetap rendah agar orang mau memakai produknya
Saya sudah membagikan ini beberapa bulan lalu, tapi hampir tidak mendapat tanggapan. Ini tulisan yang sangat bagus yang menjelaskan ekonomi penjualan ulang token di Tiongkok: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
- Ini bagus untuk persaingan. Penjual Tiongkok menawarkan solusi yang lebih murah; itulah yang saya pelajari sebagai pasar bebas dalam ekonomi
  Saya juga belajar bahwa kalau Anthropic ingin bersaing, mereka harus bekerja lebih baik. Kalau tidak, orang lain yang akan menang
  Apa sekarang prinsip ini tidak berlaku untuk perusahaan raksasa AS
- Penjelasan bahwa DeepSeek dan GLM murah karena harus bersaing dengan harga token yang sangat rendah di Tiongkok sama sekali tidak meyakinkan
  DeepSeek dan GLM berbobot terbuka, dan penyedia inferensi AS juga menjualnya jauh lebih murah. Harganya murah karena modelnya lebih efisien
- Kalau maksudnya mereka menggabungkan akun Claude Max 5x untuk menjual ulang kapasitas, memakai penipuan pembayaran, dan menjual output model ke berbagai lembaga riset Tiongkok, apakah itu benar-benar lebih murah daripada mendapatkan akun sendiri secara langsung?
  Kalau tidak, ini terdengar seperti argumen umum dari kubu pesimistis AI bahwa “Anthropic/OpenAI menjual token senilai $1.000 seharga $100 dan kehilangan banyak uang”
- Anthropic tampaknya bisa mengerahkan Mythos di sini untuk menangani masalah reseller secara langsung. Mereka bisa membeli banyak akun lewat reseller, mengirim pesan yang mengandung UID, menangkapnya di log Anthropic, lalu menjalankan loop untuk menutup akun tersebut dan mengidentifikasi akun terkait lewat metadata
- Para reseller itu sebenarnya cuma menjual Kimi K2.5 atau GLM5.1 sambil mengaku itu Opus. Orang Tiongkok sudah lama tahu cara memainkan permainan pemalsuan di banyak industri
Tindakan Alibaba dijelaskan sebagai upaya “distilasi”, yang oleh Anthropic disebut sebagai melatih model yang lebih lemah menggunakan output dari model yang lebih kuat
Claude menggunakan konten dalam skala terabita untuk melatih modelnya sendiri tanpa izin, dan itu mereka anggap tidak masalah. Sekarang ketika seseorang memakai output model Claude untuk melatih model lain, mereka berteriak bahwa itu tidak adil
- Itu memang tidak baik-baik saja. Mereka harus membayar $1 miliar
Akan menarik melihat persidangan di mana Anthropic harus mengungkap asal data pelatihannya, dan menjelaskan mengapa mereka boleh menjual data pelatihan yang dimuntahkan kembali kepada pelanggan, tetapi Alibaba tidak boleh melatih modelnya sendiri dengan model Anthropic
Sepertinya akan seru
- Mereka sudah mengungkapkannya dan membayar $1,5 miliar: https://authorsguild.org/advocacy/artificial-intelligence/wh...
- Jika ada satu saja sumber GPL di dalamnya, bobotnya harus dirilis dengan lisensi GPL
- Lebih menguntungkan untuk bersikap agresif dan berisik daripada konsisten secara logis
- Saya bisa memahami sentimen itu, tetapi melihat posisi internasional para pihak dan hubungan mereka yang rumit, tampaknya kecil kemungkinan ini benar-benar sampai ke pengadilan
  Tindakan Anthropic terlihat seperti gestur performatif. Orang lain juga sudah menebak-nebak siapa audiens yang sebenarnya dituju
Tepatnya, apa yang disebut ilegal di sini?
Secara hukum, output model tidak bisa dilindungi sebagai hak kekayaan intelektual, baik menurut hukum nasional maupun internasional. Maksimal yang bisa diharapkan adalah upaya perdata, dan itu pun sulit mengingat cara mereka sendiri melatih model secara harfiah bersifat ilegal
Anthropic diperlakukan persis seperti cara mereka memperlakukan semua orang lain. Mereka sendiri yang membuat tempat tidurnya, jadi sekarang mereka juga harus tidur di situ
- Anthropic adalah ahli Newspeak. Sebelumnya, dalam kasus Mythos pun mereka mengganti istilah bug menjadi kerentanan. Distilasi hanyalah pelanggaran syarat layanan; itu bukan tindak pidana, melainkan masalah perdata. Itu tidak ilegal, dan bukan pelanggaran hukum sama sekali
Tindakan Alibaba disebut sebagai “distilasi”, yaitu melatih model yang lebih lemah dengan keluaran dari model yang lebih kuat, dan saya tidak paham apa yang salah dari itu
Anthropic mengatakan kampanye ini berlangsung dari 22 April 2026 hingga 5 Juni, dan menghasilkan lebih dari 28,8 juta interaksi dengan Claude melalui hampir 25.000 akun penipuan
Apa yang membuat akun-akun itu menjadi penipuan. Kalau mereka membayar harga yang disepakati, bukankah itu tidak masalah. Jika mereka tidak membayar, mengapa Anthropic tetap memberikan layanan
- Apa yang membuatnya menjadi akun penipuan? Bisa jadi identitas palsu, dan bisa juga penipuan secara umum tentang tujuan penggunaan
- Karena syarat layanan Anthropic memuat jauh lebih banyak ketentuan daripada sekadar “asal bayar, layanan bisa dipakai untuk tujuan apa pun”
- Mereka juga bisa membaca jejak penalaran lalu belajar sendiri, bukan? /s
Distilasi pada dasarnya tidak bisa dicegah. Yang bisa dilakukan hanyalah memperlambatnya. Coba bantah
Pada akhirnya, perusahaan-perusahaan Tiongkok akan merilis ekstensi seperti Honey, menumpang di atas pelanggan nyata non-Tiongkok, dan pada akhirnya tetap mengirim semuanya ke Tiongkok
Sudah selesai
- Untuk mencegah distilasi kemampuan tertentu seperti penulisan kode atau pencarian kerentanan, tampaknya sudah terlambat [1]
  Namun, lab AI masih bisa terus menciptakan nilai ekonomi yang sangat besar tanpa merilis modelnya dan tanpa mengeksposnya pada potensi distilasi. Misalnya, mereka bisa memakai model itu hanya secara internal untuk mengembangkan obat
  Saya berharap suatu hari nanti ada masa depan di mana pihak lain juga bisa mengakses model terdepan, tetapi jika dinilai lebih penting untuk mencegah penyebaran melalui distilasi, itu tidak mutlak diperlukan
  [1]: Referensi terkait distilasi di https://dualuse.dev/posts/export-controls-on-fable
- Yang saya kurang pahami adalah, distilasi yang kita lihat seolah hanya terjadi di Tiongkok. Apa yang mencegah perusahaan teknologi di Inggris atau Jerman dan negara lain melakukan distilasi terhadap Claude, GPT, dan sebagainya. Apakah sekadar karena mereka tidak cukup mampu
  Intinya, mungkin tidak ada solusi teknis, tetapi secara teoretis bisa ada solusi politik
- Selama model terus berkembang, model hasil distilasi pasti akan tertinggal. Model terus berkembang. Mungkin suatu saat di masa depan ini akan berakhir
  Makalah Berkeley “False Promise of Imitating Proprietary LLMs” juga berpendapat bahwa peniruan memang cepat memperkecil kesenjangan gaya, tetapi kesenjangan kemampuan tetap besar
  https://arxiv.org/abs/2305.15717
- Saya bahkan tidak bisa memikirkan alasan untuk menganggap ini salah
- Ini sama saja dengan kenyataan bahwa web scraping tidak bisa dicegah. Coba bantah

Anthropic: “Alibaba mengekstraksi kapabilitas model AI Claude secara ilegal”

Dugaan ekstraksi ilegal terkait Alibaba

Metode distillation dan skala serangan

Klaim keterkaitan dengan Alibaba Qwen dan penerima surat

Kasus sebelumnya yang melibatkan laboratorium AI China

Langkah pemerintah AS dan pembatasan model Anthropic

Bacaan terkait

1 komentar

Komentar Hacker News