- Meta dan CEO Mark Zuckerberg digugat oleh 5 penerbit dan Scott Turow atas tuduhan menyalin secara ilegal jutaan buku, makalah, artikel, dan karya berhak cipta lainnya untuk melatih sistem AI
- Meta dituduh mengunduh jutaan materi berhak cipta melalui torrent dari situs bajakan yang terkenal buruk, serta berulang kali menyalin data hasil web scraping tanpa izin untuk digunakan dalam pelatihan Llama
- Gugatan diajukan pada 5 Mei 2026 di Pengadilan Distrik AS untuk Distrik Selatan New York, dengan Hachette, Macmillan, McGraw Hill, Elsevier, Cengage, dan Scott Turow menuntut ganti rugi uang dalam jumlah yang tidak disebutkan
- Meta menyatakan akan melawan gugatan ini secara agresif, dengan alasan sudah ada putusan pengadilan yang menyatakan penggunaan materi berhak cipta untuk pelatihan AI dapat termasuk fair use; pada Juni 2025, klaim para penulis terkait pelatihan Llama juga pernah ditolak
- Gugatan ini menonjolkan perbedaan utama bahwa Meta sempat meninjau strategi lisensi tetapi menghentikannya atas arahan pribadi Zuckerberg, dan menyetujui pengunduhan lebih dari 267TB materi bajakan meski mengetahui risiko penggunaan LibGen
Inti gugatan
- Meta dan CEO Mark Zuckerberg digugat oleh 5 penerbit dan penulis Scott Turow atas tuduhan menyalin secara ilegal jutaan buku, makalah, artikel, dan karya berhak cipta lainnya untuk melatih sistem AI
- Meta dan Zuckerberg dituduh mengikuti slogan terkenal Meta, “move fast and break things”, untuk membangun model AI generatif, dan mengunduh melalui torrent jutaan buku dan artikel jurnal berhak cipta dari situs bajakan yang terkenal buruk
- Meta juga dituduh mengunduh data hasil web scraping tanpa izin yang setara dengan hampir seluruh internet, lalu menyalinnya berkali-kali untuk melatih sistem AI generatif bernilai miliaran dolar milik Meta, Llama
- Tindakan ini disebut sebagai “salah satu pelanggaran materi berhak cipta terbesar dalam sejarah”
Penggugat dan isi tuntutan
- Gugatan diajukan pada hari Selasa, 5 Mei 2026, di Pengadilan Distrik AS untuk Distrik Selatan New York
- Penggugat terdiri dari 5 penerbit, yaitu Hachette, Macmillan, McGraw Hill, Elsevier, Cengage, serta Scott Turow secara pribadi
- Gugatan class action yang diusulkan menuntut ganti rugi uang dalam jumlah yang tidak disebutkan atas dugaan pelanggaran hak cipta
- Salinan gugatan tersedia di tautan ini
Bantahan Meta dan preseden sebelumnya
- Juru bicara Meta menyatakan, “AI memungkinkan inovasi, produktivitas, dan kreativitas bagi individu maupun bisnis, dan pengadilan telah dengan tepat memutuskan bahwa penggunaan materi berhak cipta untuk pelatihan AI dapat termasuk fair use”
- Meta menyatakan akan menghadapi gugatan ini secara agresif
- Ada kasus sebelumnya di mana para penulis menggugat perusahaan AI atas pelanggaran hak cipta namun kalah
- Pada Juni 2025, hakim federal menolak klaim dari 13 penulis termasuk Sarah Silverman dan Junot Díaz yang menuduh pelatihan model AI Meta melanggar hak cipta
- Saat itu, Hakim Vincent Chhabria memutuskan bahwa penggunaan dataset berisi sekitar 200.000 buku oleh Meta untuk melatih model bahasa Llama termasuk fair use
Perbedaan utama gugatan kali ini
- Gugatan kali ini menekankan bahwa Meta dan Zuckerberg sengaja menghindari perlindungan hak cipta
- Meta dituduh sempat mempertimbangkan skema lisensi karya, namun meninggalkan strategi itu atas “arahan pribadi Zuckerberg”
- Gugatan ini berpendapat bahwa tindakan yang dipermasalahkan berada di luar cakupan perlindungan klausul fair use dalam hukum hak cipta AS
- Dalam gugatan disebutkan bahwa Meta, atas arahan Zuckerberg, menyalin tanpa izin jutaan buku, artikel jurnal, dan karya lain, termasuk karya yang dimiliki atau dikelola oleh para penggugat dan anggota kelompok, lalu membuat salinan tambahan untuk pelatihan Llama
- Zuckerberg dituduh “secara pribadi menyetujui dan secara aktif mendorong” pelanggaran tersebut
- Meta juga dituduh menghapus informasi pengelolaan hak cipta dari karya yang dicuri untuk menyembunyikan sumber pelatihan dan mempermudah penggunaan tanpa izin
Peninjauan lisensi dan penghentiannya
- Menurut gugatan, Meta sempat mempertimbangkan perjanjian lisensi dengan penerbit besar setelah peluncuran Llama 1
- Dari Januari hingga April 2023, Meta membahas peningkatan anggaran lisensi dataset perusahaan hingga maksimum $200 juta
- Pada awal April 2023, Meta disebut tiba-tiba menghentikan strategi lisensi tersebut
- Gugatan menyebut bahwa persoalan apakah Meta akan melisensikan materi berhak cipta ke depan atau menggunakan materi bajakan “dieskalasikan” kepada Zuckerberg
- Setelah eskalasi tersebut, tim pengembangan bisnis Meta disebut menerima instruksi lisan untuk menghentikan upaya lisensi, menurut pihak penggugat
- Gugatan juga menyebut seorang karyawan Meta menjelaskan alasannya dengan inti bahwa “jika melisensikan bahkan satu buku saja, akan lebih sulit bergantung pada strategi fair use”
Pengalaman lisensi Meta sebelumnya
- Disebutkan bahwa Meta dan Zuckerberg sudah sangat memahami pasar lisensi materi pelatihan AI
- Menurut gugatan, pada 2022 Meta menandatangani 4 lisensi untuk set pelatihan terbatas dengan penerbit buku berbahasa Afrika
- Setelah itu, Meta juga menandatangani perjanjian lisensi dengan penerbit berita besar termasuk Fox News, CNN, dan USA Today
Penggunaan LibGen dan peninjauan risiko internal
- Menurut gugatan, pada 13 Desember 2023 para karyawan Meta mengedarkan memo internal yang membahas risiko hukum penggunaan LibGen
- Memo Meta tersebut menggambarkan LibGen sebagai “dataset yang kami ketahui merupakan bajakan”
- Gugatan juga menyatakan memo yang sama memuat isi bahwa “kami tidak akan mengungkap penggunaan dataset LibGen yang digunakan untuk pelatihan”
- Kekhawatiran ini pada akhirnya disebut tidak diindahkan
- Menurut gugatan, Zuckerberg dan eksekutif Meta lainnya menyetujui dan memerintahkan pengunduhan torrent atas lebih dari 267TB materi bajakan
- Volume ini disebut setara dengan ratusan juta publikasi, beberapa kali lebih besar daripada keseluruhan koleksi cetak Perpustakaan Kongres AS
Klaim tentang output Llama
- Sebagai akibat dari dugaan pelanggaran tersebut, sistem AI Meta dituduh mampu menghasilkan output secara cepat dan dalam skala besar yang dapat menggantikan karya para penggugat dan anggota kelompok yang digunakan dalam pelatihan
- Menurut gugatan, pengganti semacam itu mencakup salinan yang hampir sama dengan teks asli, bab pengganti untuk buku teks akademik, serta ringkasan dan versi alternatif dari novel terkenal dan artikel jurnal
- Llama juga dituduh menghasilkan tiruan berkualitas rendah yang menyalin elemen kreatif karya asli, serta karya turunan yang secara eksklusif hanya diizinkan bagi pemegang hak
- Gugatan menyatakan bahwa Llama juga dapat menyesuaikan output agar meniru elemen ekspresi dan pilihan kreatif penulis tertentu
1 komentar
Komentar Hacker News
Banyak orang tampaknya akan senang jika karena kasus ini Zuckerberg harus membayar bahkan hanya ganti rugi minimum menurut undang-undang sebesar $750 untuk setiap pelanggaran
Dalam kasus pelanggaran Anthropic sebelumnya, dipandang bahwa pelatihan AI itu sendiri adalah penggunaan transformatif dan bukan pelanggaran pada dirinya sendiri, tetapi tindakan menyalin karya secara ilegal untuk tujuan itu jelas merupakan pelanggaran
Nilai penyelesaiannya $1,5 miliar, dan hampir $3.000 per 500 ribu salinan ilegal, jadi jika Zuckerberg menyalin jutaan karya secara ilegal maka penyelesaian $6 miliar juga terdengar cukup masuk akal
Sementara orang ini tampaknya mencuri hampir semua media yang ada dan akan lolos begitu saja karena terlalu kaya untuk dituntut
[1] misalnya: https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...
Seolah-olah dia sudah membeli perlindungan terbaik agar bisa melanggar hukum
Pada dasarnya mereka mengambil paksa semuanya tanpa bertanya, lalu belakangan baru menawar harganya. Ke mana perginya tuntutan pidana, atau kalau bukan penjara, setidaknya penyitaan aset saham?
Dulu mereka menggugat habis-habisan mahasiswa yang hanya mengunduh MP3 tanpa menyebarkannya kembali
Alasannya tidak ada transformasi yang layak disebut fair use, hanya sekadar mengunduh file, dan pelajaran yang dipetik adalah para mahasiswa itu seharusnya mencuri jutaan file saja sekalian
Jika pengguna akhir juga bisa dituntut, maka wacananya berubah dari positif menjadi negatif, dan pihak yang berkuasa jadi lebih mudah menekan perilaku itu
Beberapa minggu lalu aku harus memblokir ASN Meta dari server cgit pribadi. Mereka mengabaikan robots.txt dan membuat serverku kewalahan
Mereka tampak jelas tersebar di berbagai blok jaringan untuk menghindari pembatasan berbasis IP, dan gara-gara mereka saja access log menumpuk sampai ratusan MB. Sulit dipercaya
Kelihatannya seperti hendak mem-proxy kueri pengguna ke endpoint pencarian, dan ASN-nya cocok jadi bukan ada orang yang pura-pura jadi Meta
Lucu melihat orang-orang tiba-tiba membela Elsevier. Menurut hukum yang berlaku, pelatihan AI tampak jelas merupakan fair use yang transformatif
Mungkin kasus ini justru bisa menjadi preseden yang membuktikannya
Aku mendukung dekriminalisasi atau legalisasi ganja dalam jumlah kecil untuk penggunaan pribadi, tapi itu tidak berarti aku mendukung produksi narkotika industri raksasa yang sampai mendistorsi ekonomi, atau perusahaan yang ingin memasukkan metamfetamin ke semua produk
“Mereka menyalin lagi hasil curian itu,” tapi apa tepatnya yang “dicuri”? Bukankah pemilik aslinya masih tetap memiliki barang yang katanya dicuri itu?
Dalam Dowling v. United States, 473 U.S. 207 (1985), Mahkamah Agung memutuskan bahwa penjualan tanpa izin rekaman karya musik berhak cipta tidak termasuk barang yang “dicuri, digelapkan, atau diperoleh dengan penipuan” menurut National Stolen Property Act
Bahkan jika demi argumen itu dianggap dicuri, tujuan hak cipta adalah “mendorong kemajuan ilmu pengetahuan dan seni yang berguna dengan menjamin kepada penulis dan penemu, untuk jangka waktu terbatas, hak eksklusif atas tulisan dan penemuan mereka masing-masing”
Akan sangat sulit membuktikan bahwa LLM tidak memajukan seni dan ilmu pengetahuan, jadi setidaknya aku melihatnya sebagai penggunaan transformatif, yaitu fair use
[0] https://news.ycombinator.com/item?id=48026207#48029072
Ini mirip seperti orang yang menjual keyboard lalu menuntut royalti atas perangkat lunak yang dibuat dengan keyboard itu
Tidak penting bahwa penulis buku tidak bisa memprediksi kasus penggunaan baru berupa pelatihan LLM. Buku itu tidak berada di dalam LLM, juga tidak dijual bersama LLM. Itu hanya salah satu dari miliaran alat yang dipakai untuk membuat LLM
Rasanya gila membingkai hal ini seolah perusahaan AI sedang mengekstraksi nilai dari pemegang kekayaan intelektual malang seperti Disney. Konten itu adalah warisan budaya kita dan pada dasarnya sudah menjadi milik kita. Hanya saja ada orang bodoh tertentu yang diberi hak monopoli eksploitasi seumur hidup
LLM dilatih dari data yang sebenarnya sudah kita miliki. Disney dan lainnya hanya ingin memeras lebih banyak uang dari sesuatu yang dibuat puluhan tahun lalu dengan memanfaatkan teknologi baru
Dalam penilaian paling buruk pun, ini adalah reverse engineering, dan di AS seharusnya dilindungi sebagai fair use, meski perlindungan itu tampaknya telah agak terkikis
Aku penasaran bagaimana hasil soal tanggung jawab pribadi
Di perusahaan, tanggung jawab terlalu sering menguap begitu saja, dan aku selalu penasaran apa justifikasi hukumnya. Sejauh ini alasan yang tersisa hanya semacam “ya begitulah” dan “sepertinya pasal terkait tidak berlaku”, dan keduanya bukan alasan yang bagus
Aku sempat ingin bercanda bahwa kalau jasad Aaron Swartz ditempeli magnet, dia sekarang akan berputar sangat cepat sampai bisa jadi sumber energi yang kuat
Tapi sejujurnya, melihat bagaimana kasusnya ditangani dan betapa sedikitnya yang membaik sesudah itu, dia mungkin memang sudah memperkirakan hal seperti ini
Tuduhannya adalah penipuan, akses ilegal ke komputer yang dilindungi, dan perusakan komputer
Seiring waktu, dasar kasus itu dilupakan dan digantikan asumsi bahwa itu adalah kasus pembajakan, padahal sebenarnya itu adalah perkara akses ilegal
Jika Zuckerberg tidak dihukum berat karena ini, setidaknya semoga tercipta preseden hukum bahwa semua orang lain juga kebal jika melakukan hal yang sama
Semua Aaron Swartz di masa depan seharusnya bisa membagikan makalah ilmiah secara bebas ke seluruh dunia
Aku secara pribadi mengenal seorang engineer yang diperintahkan melakukan sesuatu meski tahu ada banyak masalah hukum, dengan alasan perusahaan punya pengacara untuk itu
Menjadi whistleblower juga bukan pilihan yang bagus dalam kondisi ekonomi sekarang, tapi tetap saja aku berharap lebih banyak orang melakukannya
Jadi maksudnya “bergerak cepat dan mencuri barang”?
Kecepatan mereka menyapu dan mengikis situs jauh lebih berlebihan dibanding apa yang biasa disebut crawler yang sah, dan itu tampak sebagai penjelasan yang paling masuk akal
Baik CEO yang menyetujuinya maupun pejabat senior lain yang menyetujuinya, tanggung jawab perusahaan sepertinya tidak akan berubah
Pertanyaan yang harus dijawab adalah apakah itu benar terjadi, dan jika iya apakah itu merupakan pelanggaran hak cipta yang tidak dilindungi fair use, bukan eksekutif perusahaan mana yang menyetujuinya
Aaron Swartz menghadapi ancaman hukuman penjara bertahun-tahun karena mencoba mengunduh makalah jurnal ilmiah dan membagikannya gratis kepada dunia, tanpa mengambil keuntungan apa pun, lalu akhirnya mengakhiri hidupnya
Tapi ketika perusahaan bernilai miliaran dolar mengunduh jutaan karya berhak cipta, lalu memakai dataset itu untuk melatih jenis model kecerdasan buatan baru yang ingin membentuk ulang seluruh pasar tenaga kerja, itu malah disebut inovasi ala Silicon Valley dan seolah layak diberi medali
Rasanya Meta tidak mungkin menghapus salinan lokal mereka
Yang perlu ditentang adalah hukum dan perlakuan seperti itu, bukan menggunakannya sebagai alat pembalasan terhadap pihak lain
Menuntut agar semua orang diperlakukan sama tidak adilnya adalah keliru. Lebih baik menuntut penghapusan hukum dan struktur yang buruk