1 poin oleh GN⁺ 1 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Meta dan CEO Mark Zuckerberg digugat oleh 5 penerbit dan Scott Turow atas tuduhan menyalin secara ilegal jutaan buku, makalah, artikel, dan karya berhak cipta lainnya untuk melatih sistem AI
  • Meta dituduh mengunduh jutaan materi berhak cipta melalui torrent dari situs bajakan yang terkenal buruk, serta berulang kali menyalin data hasil web scraping tanpa izin untuk digunakan dalam pelatihan Llama
  • Gugatan diajukan pada 5 Mei 2026 di Pengadilan Distrik AS untuk Distrik Selatan New York, dengan Hachette, Macmillan, McGraw Hill, Elsevier, Cengage, dan Scott Turow menuntut ganti rugi uang dalam jumlah yang tidak disebutkan
  • Meta menyatakan akan melawan gugatan ini secara agresif, dengan alasan sudah ada putusan pengadilan yang menyatakan penggunaan materi berhak cipta untuk pelatihan AI dapat termasuk fair use; pada Juni 2025, klaim para penulis terkait pelatihan Llama juga pernah ditolak
  • Gugatan ini menonjolkan perbedaan utama bahwa Meta sempat meninjau strategi lisensi tetapi menghentikannya atas arahan pribadi Zuckerberg, dan menyetujui pengunduhan lebih dari 267TB materi bajakan meski mengetahui risiko penggunaan LibGen

Inti gugatan

  • Meta dan CEO Mark Zuckerberg digugat oleh 5 penerbit dan penulis Scott Turow atas tuduhan menyalin secara ilegal jutaan buku, makalah, artikel, dan karya berhak cipta lainnya untuk melatih sistem AI
  • Meta dan Zuckerberg dituduh mengikuti slogan terkenal Meta, “move fast and break things”, untuk membangun model AI generatif, dan mengunduh melalui torrent jutaan buku dan artikel jurnal berhak cipta dari situs bajakan yang terkenal buruk
  • Meta juga dituduh mengunduh data hasil web scraping tanpa izin yang setara dengan hampir seluruh internet, lalu menyalinnya berkali-kali untuk melatih sistem AI generatif bernilai miliaran dolar milik Meta, Llama
  • Tindakan ini disebut sebagai “salah satu pelanggaran materi berhak cipta terbesar dalam sejarah”

Penggugat dan isi tuntutan

  • Gugatan diajukan pada hari Selasa, 5 Mei 2026, di Pengadilan Distrik AS untuk Distrik Selatan New York
  • Penggugat terdiri dari 5 penerbit, yaitu Hachette, Macmillan, McGraw Hill, Elsevier, Cengage, serta Scott Turow secara pribadi
  • Gugatan class action yang diusulkan menuntut ganti rugi uang dalam jumlah yang tidak disebutkan atas dugaan pelanggaran hak cipta
  • Salinan gugatan tersedia di tautan ini

Bantahan Meta dan preseden sebelumnya

  • Juru bicara Meta menyatakan, “AI memungkinkan inovasi, produktivitas, dan kreativitas bagi individu maupun bisnis, dan pengadilan telah dengan tepat memutuskan bahwa penggunaan materi berhak cipta untuk pelatihan AI dapat termasuk fair use”
  • Meta menyatakan akan menghadapi gugatan ini secara agresif
  • Ada kasus sebelumnya di mana para penulis menggugat perusahaan AI atas pelanggaran hak cipta namun kalah
  • Pada Juni 2025, hakim federal menolak klaim dari 13 penulis termasuk Sarah Silverman dan Junot Díaz yang menuduh pelatihan model AI Meta melanggar hak cipta
  • Saat itu, Hakim Vincent Chhabria memutuskan bahwa penggunaan dataset berisi sekitar 200.000 buku oleh Meta untuk melatih model bahasa Llama termasuk fair use

Perbedaan utama gugatan kali ini

  • Gugatan kali ini menekankan bahwa Meta dan Zuckerberg sengaja menghindari perlindungan hak cipta
  • Meta dituduh sempat mempertimbangkan skema lisensi karya, namun meninggalkan strategi itu atas “arahan pribadi Zuckerberg”
  • Gugatan ini berpendapat bahwa tindakan yang dipermasalahkan berada di luar cakupan perlindungan klausul fair use dalam hukum hak cipta AS
  • Dalam gugatan disebutkan bahwa Meta, atas arahan Zuckerberg, menyalin tanpa izin jutaan buku, artikel jurnal, dan karya lain, termasuk karya yang dimiliki atau dikelola oleh para penggugat dan anggota kelompok, lalu membuat salinan tambahan untuk pelatihan Llama
  • Zuckerberg dituduh “secara pribadi menyetujui dan secara aktif mendorong” pelanggaran tersebut
  • Meta juga dituduh menghapus informasi pengelolaan hak cipta dari karya yang dicuri untuk menyembunyikan sumber pelatihan dan mempermudah penggunaan tanpa izin

Peninjauan lisensi dan penghentiannya

  • Menurut gugatan, Meta sempat mempertimbangkan perjanjian lisensi dengan penerbit besar setelah peluncuran Llama 1
  • Dari Januari hingga April 2023, Meta membahas peningkatan anggaran lisensi dataset perusahaan hingga maksimum $200 juta
  • Pada awal April 2023, Meta disebut tiba-tiba menghentikan strategi lisensi tersebut
  • Gugatan menyebut bahwa persoalan apakah Meta akan melisensikan materi berhak cipta ke depan atau menggunakan materi bajakan “dieskalasikan” kepada Zuckerberg
  • Setelah eskalasi tersebut, tim pengembangan bisnis Meta disebut menerima instruksi lisan untuk menghentikan upaya lisensi, menurut pihak penggugat
  • Gugatan juga menyebut seorang karyawan Meta menjelaskan alasannya dengan inti bahwa “jika melisensikan bahkan satu buku saja, akan lebih sulit bergantung pada strategi fair use”

Pengalaman lisensi Meta sebelumnya

  • Disebutkan bahwa Meta dan Zuckerberg sudah sangat memahami pasar lisensi materi pelatihan AI
  • Menurut gugatan, pada 2022 Meta menandatangani 4 lisensi untuk set pelatihan terbatas dengan penerbit buku berbahasa Afrika
  • Setelah itu, Meta juga menandatangani perjanjian lisensi dengan penerbit berita besar termasuk Fox News, CNN, dan USA Today

Penggunaan LibGen dan peninjauan risiko internal

  • Menurut gugatan, pada 13 Desember 2023 para karyawan Meta mengedarkan memo internal yang membahas risiko hukum penggunaan LibGen
  • Memo Meta tersebut menggambarkan LibGen sebagai “dataset yang kami ketahui merupakan bajakan”
  • Gugatan juga menyatakan memo yang sama memuat isi bahwa “kami tidak akan mengungkap penggunaan dataset LibGen yang digunakan untuk pelatihan”
  • Kekhawatiran ini pada akhirnya disebut tidak diindahkan
  • Menurut gugatan, Zuckerberg dan eksekutif Meta lainnya menyetujui dan memerintahkan pengunduhan torrent atas lebih dari 267TB materi bajakan
  • Volume ini disebut setara dengan ratusan juta publikasi, beberapa kali lebih besar daripada keseluruhan koleksi cetak Perpustakaan Kongres AS

Klaim tentang output Llama

  • Sebagai akibat dari dugaan pelanggaran tersebut, sistem AI Meta dituduh mampu menghasilkan output secara cepat dan dalam skala besar yang dapat menggantikan karya para penggugat dan anggota kelompok yang digunakan dalam pelatihan
  • Menurut gugatan, pengganti semacam itu mencakup salinan yang hampir sama dengan teks asli, bab pengganti untuk buku teks akademik, serta ringkasan dan versi alternatif dari novel terkenal dan artikel jurnal
  • Llama juga dituduh menghasilkan tiruan berkualitas rendah yang menyalin elemen kreatif karya asli, serta karya turunan yang secara eksklusif hanya diizinkan bagi pemegang hak
  • Gugatan menyatakan bahwa Llama juga dapat menyesuaikan output agar meniru elemen ekspresi dan pilihan kreatif penulis tertentu

1 komentar

 
GN⁺ 1 jam lalu
Komentar Hacker News
  • Banyak orang tampaknya akan senang jika karena kasus ini Zuckerberg harus membayar bahkan hanya ganti rugi minimum menurut undang-undang sebesar $750 untuk setiap pelanggaran
    Dalam kasus pelanggaran Anthropic sebelumnya, dipandang bahwa pelatihan AI itu sendiri adalah penggunaan transformatif dan bukan pelanggaran pada dirinya sendiri, tetapi tindakan menyalin karya secara ilegal untuk tujuan itu jelas merupakan pelanggaran
    Nilai penyelesaiannya $1,5 miliar, dan hampir $3.000 per 500 ribu salinan ilegal, jadi jika Zuckerberg menyalin jutaan karya secara ilegal maka penyelesaian $6 miliar juga terdengar cukup masuk akal

    • Mengingat anak-anak yang dulu dihukum pidana hanya karena menjalankan situs MP3[1], ini terasa menjengkelkan
      Sementara orang ini tampaknya mencuri hampir semua media yang ada dan akan lolos begitu saja karena terlalu kaya untuk dituntut
      [1] misalnya: https://en.wikipedia.org/wiki/Oink%27s_Pink_Palace#Legal_pro...
    • Selama DJT menjadi presiden, sepertinya tidak akan terjadi apa-apa pada Zuckerberg maupun Meta
      Seolah-olah dia sudah membeli perlindungan terbaik agar bisa melanggar hukum
    • Ini sama sekali tidak mengesankan. Aku tidak paham bagaimana mereka masih bisa terus menjadi monopolis/hegemon AI setelah melakukan ini
      Pada dasarnya mereka mengambil paksa semuanya tanpa bertanya, lalu belakangan baru menawar harganya. Ke mana perginya tuntutan pidana, atau kalau bukan penjara, setidaknya penyitaan aset saham?
    • Aku tidak pernah menyangka akhirnya akan mendukung pengacara kekayaan intelektual
    • Dalam konteks ini, kekayaan bersih Zuckerberg sekitar $220 miliar
  • Dulu mereka menggugat habis-habisan mahasiswa yang hanya mengunduh MP3 tanpa menyebarkannya kembali
    Alasannya tidak ada transformasi yang layak disebut fair use, hanya sekadar mengunduh file, dan pelajaran yang dipetik adalah para mahasiswa itu seharusnya mencuri jutaan file saja sekalian

    • Itu mungkin merupakan kampanye pembentukan opini publik informasi
      Jika pengguna akhir juga bisa dituntut, maka wacananya berubah dari positif menjadi negatif, dan pihak yang berkuasa jadi lebih mudah menekan perilaku itu
    • Pembeda yang sebenarnya adalah apakah kamu sangat kaya atau tidak
  • Beberapa minggu lalu aku harus memblokir ASN Meta dari server cgit pribadi. Mereka mengabaikan robots.txt dan membuat serverku kewalahan
    Mereka tampak jelas tersebar di berbagai blok jaringan untuk menghindari pembatasan berbasis IP, dan gara-gara mereka saja access log menumpuk sampai ratusan MB. Sulit dipercaya

    • Tahun lalu aku mengalami hal yang sama. Mereka terus merayapi URL acak yang tidak ada tanpa henti
      Kelihatannya seperti hendak mem-proxy kueri pengguna ke endpoint pencarian, dan ASN-nya cocok jadi bukan ada orang yang pura-pura jadi Meta
    • Menurutku pemblokiran berbasis ASN seharusnya jauh lebih umum. Sayangnya, banyak alat umum tidak mendukungnya sebagai opsi konfigurasi kelas satu
    • Aku penasaran bagaimana cara mengidentifikasi perusahaan-perusahaan seperti ini. Apakah ada layanan untuk mengetahui perusahaan mana yang telah mengikis situsku?
  • Lucu melihat orang-orang tiba-tiba membela Elsevier. Menurut hukum yang berlaku, pelatihan AI tampak jelas merupakan fair use yang transformatif
    Mungkin kasus ini justru bisa menjadi preseden yang membuktikannya

    • Mengganggu sekali melihat para pendukung AI menggambarkan orang-orang yang selama 20 tahun terakhir melawan industri hak cipta seolah-olah tiba-tiba membalik posisi hanya karena mereka menentang industri AI
      Aku mendukung dekriminalisasi atau legalisasi ganja dalam jumlah kecil untuk penggunaan pribadi, tapi itu tidak berarti aku mendukung produksi narkotika industri raksasa yang sampai mendistorsi ekonomi, atau perusahaan yang ingin memasukkan metamfetamin ke semua produk
    • Menurutku ini memang lucu. Aku juga mengatakan hal ini di thread lain dan postingan[0]
      “Mereka menyalin lagi hasil curian itu,” tapi apa tepatnya yang “dicuri”? Bukankah pemilik aslinya masih tetap memiliki barang yang katanya dicuri itu?
      Dalam Dowling v. United States, 473 U.S. 207 (1985), Mahkamah Agung memutuskan bahwa penjualan tanpa izin rekaman karya musik berhak cipta tidak termasuk barang yang “dicuri, digelapkan, atau diperoleh dengan penipuan” menurut National Stolen Property Act
      Bahkan jika demi argumen itu dianggap dicuri, tujuan hak cipta adalah “mendorong kemajuan ilmu pengetahuan dan seni yang berguna dengan menjamin kepada penulis dan penemu, untuk jangka waktu terbatas, hak eksklusif atas tulisan dan penemuan mereka masing-masing”
      Akan sangat sulit membuktikan bahwa LLM tidak memajukan seni dan ilmu pengetahuan, jadi setidaknya aku melihatnya sebagai penggunaan transformatif, yaitu fair use
      [0] https://news.ycombinator.com/item?id=48026207#48029072
    • Menurutku bahkan tidak perlu sampai menyebut “pelatihan AI adalah fair use transformatif menurut hukum saat ini”. Ini sepenuhnya adalah produk baru
      Ini mirip seperti orang yang menjual keyboard lalu menuntut royalti atas perangkat lunak yang dibuat dengan keyboard itu
      Tidak penting bahwa penulis buku tidak bisa memprediksi kasus penggunaan baru berupa pelatihan LLM. Buku itu tidak berada di dalam LLM, juga tidak dijual bersama LLM. Itu hanya salah satu dari miliaran alat yang dipakai untuk membuat LLM
      Rasanya gila membingkai hal ini seolah perusahaan AI sedang mengekstraksi nilai dari pemegang kekayaan intelektual malang seperti Disney. Konten itu adalah warisan budaya kita dan pada dasarnya sudah menjadi milik kita. Hanya saja ada orang bodoh tertentu yang diberi hak monopoli eksploitasi seumur hidup
      LLM dilatih dari data yang sebenarnya sudah kita miliki. Disney dan lainnya hanya ingin memeras lebih banyak uang dari sesuatu yang dibuat puluhan tahun lalu dengan memanfaatkan teknologi baru
      Dalam penilaian paling buruk pun, ini adalah reverse engineering, dan di AS seharusnya dilindungi sebagai fair use, meski perlindungan itu tampaknya telah agak terkikis
    • Biasanya pokok masalahnya bukan apakah itu transformatif, melainkan bahwa mereka memperoleh materi berhak cipta secara ilegal
    • Menurutku, baik Elsevier maupun orang-orang yang mengambil kekayaan intelektual tanpa persetujuan penulis untuk pelatihan AI distribusi komersial, keduanya seharusnya legal
  • Aku penasaran bagaimana hasil soal tanggung jawab pribadi
    Di perusahaan, tanggung jawab terlalu sering menguap begitu saja, dan aku selalu penasaran apa justifikasi hukumnya. Sejauh ini alasan yang tersisa hanya semacam “ya begitulah” dan “sepertinya pasal terkait tidak berlaku”, dan keduanya bukan alasan yang bagus
    Aku sempat ingin bercanda bahwa kalau jasad Aaron Swartz ditempeli magnet, dia sekarang akan berputar sangat cepat sampai bisa jadi sumber energi yang kuat
    Tapi sejujurnya, melihat bagaimana kasusnya ditangani dan betapa sedikitnya yang membaik sesudah itu, dia mungkin memang sudah memperkirakan hal seperti ini

    • Penanganan kasus Aaron Swartz memang sebuah bencana, tapi dia tidak didakwa atas tuduhan pembajakan
      Tuduhannya adalah penipuan, akses ilegal ke komputer yang dilindungi, dan perusakan komputer
      Seiring waktu, dasar kasus itu dilupakan dan digantikan asumsi bahwa itu adalah kasus pembajakan, padahal sebenarnya itu adalah perkara akses ilegal
    • Di realitas lain, Aaron Swartz tidak dipuja secara berlebihan dan mungkin sekarang menjalankan startup AI/kripto yang membayar orang untuk mengunggah data pelatihan bersama teman-teman sesama alumnus YC
  • Jika Zuckerberg tidak dihukum berat karena ini, setidaknya semoga tercipta preseden hukum bahwa semua orang lain juga kebal jika melakukan hal yang sama
    Semua Aaron Swartz di masa depan seharusnya bisa membagikan makalah ilmiah secara bebas ke seluruh dunia

    • Menurutku mereka kemungkinan besar akan menggunakan lobi untuk menciptakan regulatory capture, lalu menaikkan hambatan bagi peserta kecil
  • Aku secara pribadi mengenal seorang engineer yang diperintahkan melakukan sesuatu meski tahu ada banyak masalah hukum, dengan alasan perusahaan punya pengacara untuk itu

    • Akan bagus jika hal seperti itu terungkap dalam discovery ketika gugatan diajukan, tapi rasanya mungkin tidak akan pernah muncul
      Menjadi whistleblower juga bukan pilihan yang bagus dalam kondisi ekonomi sekarang, tapi tetap saja aku berharap lebih banyak orang melakukannya
  • Jadi maksudnya “bergerak cepat dan mencuri barang”?

    • Saat para pengumpul AI baru mulai, pada dasarnya memang itulah yang kupikirkan. Tampaknya rencananya adalah mengikis sebanyak mungkin sebelum orang sadar apa yang terjadi dan mulai memblokir mereka
      Kecepatan mereka menyapu dan mengikis situs jauh lebih berlebihan dibanding apa yang biasa disebut crawler yang sah, dan itu tampak sebagai penjelasan yang paling masuk akal
    • Bergerak cepat dan langgar hukum
    • Ini sudah dimulai sejak awal, dari puncaknya
    • Ini adalah pencurian terbesar dalam sejarah terhadap kelas pekerja
    • Mencuri barang? Apakah ini lagi-lagi logika “Anda tidak akan membajak mobil”, ya? Kukira kita sudah lama melewati itu
  • Baik CEO yang menyetujuinya maupun pejabat senior lain yang menyetujuinya, tanggung jawab perusahaan sepertinya tidak akan berubah
    Pertanyaan yang harus dijawab adalah apakah itu benar terjadi, dan jika iya apakah itu merupakan pelanggaran hak cipta yang tidak dilindungi fair use, bukan eksekutif perusahaan mana yang menyetujuinya

  • Aaron Swartz menghadapi ancaman hukuman penjara bertahun-tahun karena mencoba mengunduh makalah jurnal ilmiah dan membagikannya gratis kepada dunia, tanpa mengambil keuntungan apa pun, lalu akhirnya mengakhiri hidupnya
    Tapi ketika perusahaan bernilai miliaran dolar mengunduh jutaan karya berhak cipta, lalu memakai dataset itu untuk melatih jenis model kecerdasan buatan baru yang ingin membentuk ulang seluruh pasar tenaga kerja, itu malah disebut inovasi ala Silicon Valley dan seolah layak diberi medali

    • Jika satu orang mengunduh materi berhak cipta secara ilegal, itu kejahatan. Jika perusahaan multinasional mengunduh materi berhak cipta secara ilegal, itu menjadi satu-satunya area pertumbuhan yang tersisa bagi ekonomi Amerika dan sesuatu yang esensial bagi keamanan nasional
    • Setelah Aaron menghapus salinan lokalnya, Jstor mencabut gugatan. DOJ tidak mencabutnya
      Rasanya Meta tidak mungkin menghapus salinan lokal mereka
    • Aaron Swartz diperlakukan tidak adil, dan alasannya adalah karena hukum hak cipta itu buruk
      Yang perlu ditentang adalah hukum dan perlakuan seperti itu, bukan menggunakannya sebagai alat pembalasan terhadap pihak lain
      Menuntut agar semua orang diperlakukan sama tidak adilnya adalah keliru. Lebih baik menuntut penghapusan hukum dan struktur yang buruk
    • Meta memang membagikan model AI-nya ke dunia secara gratis
    • Dia benar-benar terlalu jauh di depan zamannya