14 poin oleh hongminhee 2026-01-17 | 1 komentar | Bagikan ke WhatsApp
Bukan memblokir F/OSS dari pelatihan LLM, melainkan membebaskan model hasil pelatihannya
  • Tulisan terbaru 〈Tentang FLOSS dan pelatihan LLM〉 (On FLOSS and training LLMs) dengan baik menggambarkan frustrasi komunitas F/OSS — ketidaksopanan perusahaan AI, keterbatasan hukum, dan sebagainya
  • Namun strategi mundur yang diusulkan penulis, seperti memblokir crawler, keluar dari GitHub, dan mengucilkan pengguna alat AI, justru melewatkan peluang penting
Masalahnya bukan pelatihan, melainkan enclosure
  • Masalah yang sebenarnya: bukan sekadar melatih LLM dengan kode kita, melainkan hasilnya diprivatisasi sebagai model proprietari
  • Ini bukan masalah baru — inilah masalah yang selama ini diperjuangkan F/OSS
    • privatisasi commons
    • monopoli atas pengetahuan kolektif
    • aliran nilai satu arah dari banyak orang ke segelintir pihak
Pola historis GPL: teknologi baru → eksploitasi baru → lisensi baru

Lisensi F/OSS terus berevolusi mengikuti perubahan teknologi:

  1. GPLv2 (1991) — mencegah distribusi yang hanya berupa biner → mewajibkan pembukaan source code
  2. GPLv3 (2007) — mencegah Tivoization (penguncian hardware) → juga mewajibkan informasi instalasi
  3. AGPL (2007) — menutup celah SaaS → penyediaan melalui jaringan juga dianggap distribusi

Sekarang? Muncul celah pelatihan:

  • perusahaan memakai kode F/OSS sebagai data pelatihan untuk model proprietari
  • tetapi tidak wajib membuka model ataupun mengungkap sumber pelatihannya
  • ini adalah bentuk eksploitasi yang sangat khas — ekstraksi nilai tanpa resiprositas
Solusinya: copyleft pelatihan seperti GPLv4 atau TGPL (Training GPL)

Syarat yang diusulkan:

  • pelatihan secara eksplisit diizinkan (selaras dengan prinsip kebebasan F/OSS)
  • tetapi model hasilnya harus dibebaskan — bobot harus dibuka dengan lisensi copyleft yang kompatibel
  • wajib mendokumentasikan data pelatihan
  • model yang di-fine-tune juga mewarisi kewajiban yang sama
  • penggunaan melalui jaringan (penyediaan API) juga dianggap distribusi

→ sebagaimana GPLv3 mewajibkan source code untuk biner, copyleft pelatihan akan mewajibkan bobot model untuk sistem yang telah dilatih

Mengapa ini lebih penting daripada mundur

Masalah strategi mundur:

  1. Menyerahkan medan tempur — OpenAI/Anthropic sudah lebih dulu mengeruk semua yang mereka butuhkan. Yang justru terhalang oleh strategi mundur hanyalah LLM open source seperti Llama/Mistral
  2. Salah mengidentifikasi masalah — masalahnya bukan teknologinya sendiri, melainkan siapa yang memakainya dan bagaimana cara memakainya
  3. Memecah komunitas — mengucilkan pengguna “alat yang tidak etis”? Batas penggunaannya sampai mana? Ujian kemurnian seperti ini hanya efektif untuk memecah gerakan
  4. Meninggalkan strategi inti F/OSS — kejeniusannya GPL adalah bukan melarang penggunaan, melainkan mewajibkan kebebasan diwariskan. Mundur adalah filsafat yang sepenuhnya berlawanan
Perbedaan cara membaca realitas
  • antirez (pencipta Redis): LLM tidak bisa dibalikkan → beradaptasi dan percayakan pada persaingan pasar
  • penulis artikel asli: perlawanan tetap bermakna → mundur dan blokir akses
  • artikel ini: LLM tidak bisa dibalikkan → tetapi siapa yang memilikinya adalah inti masalah

Pertanyaannya bukan apakah kita akan memakai LLM, melainkan:

  • siapa yang memiliki model?
  • siapa yang memperoleh manfaat dari commons yang dipakai untuk melatih model?
  • apakah hasil kontribusi jutaan pengembang F/OSS harus menjadi milik eksklusif segelintir pihak?

→ ini adalah soal apakah buah kerja kolektif tetap tinggal dalam kolektif, atau berubah menjadi properti privat

Sekarang adalah peluang historis
  • saat ini sedang berlangsung perbincangan tentang norma yang akan mengatur pelatihan AI dan keterbukaan model
  • diskusi komunitas sedang memanas
  • di tengah bertambahnya model AI open source, lisensi apa yang akan diterapkan masih belum ditentukan

Jika pengembang F/OSS mundur: lima tahun lagi perusahaan dan pengadilan yang ramah perusahaan akan menetapkan semua norma → celah pelatihan menjadi baku → AI open source akan dirugikan secara permanen

Jika kita ikut terlibat: dorong copyleft pelatihan → buka kode dengan lisensi yang menuntut pembebasan model → kita membentuk masa depan

Kesimpulan dalam satu kalimat

> Bukan memblokir crawler, melainkan mengubah aturan tentang crawling. Bukan menolak LLM, melainkan merebutnya kembali.

→ Sudut pandang materialisme historis: daya produktif baru (LLM) menuntut relasi produksi baru (copyleft pelatihan)
→ Seperti saat Linus merilis Linux dengan GPL dan bukannya berkata “perusahaan tidak boleh memakainya”, melainkan “siapa pun boleh memakainya, tetapi jika ada perbaikan maka bagikanlah”
→ Demi masa depan di mana, sebagaimana kode adalah milik semua orang, model AI yang dilatih darinya juga menjadi milik semua orang

1 komentar

 
roxie 2026-01-23

Saya setuju dengan isi tulisannya. Namun, ketika ditanya dari mana, apa, dan sejauh mana kita harus berjuang, rasanya buntu.