Histomat F/OSS: Kita tidak boleh menolak LLM, melainkan merebutnya kembali
(writings.hongminhee.org)Bukan memblokir F/OSS dari pelatihan LLM, melainkan membebaskan model hasil pelatihannya
- Tulisan terbaru 〈Tentang FLOSS dan pelatihan LLM〉 (On FLOSS and training LLMs) dengan baik menggambarkan frustrasi komunitas F/OSS — ketidaksopanan perusahaan AI, keterbatasan hukum, dan sebagainya
- Namun strategi mundur yang diusulkan penulis, seperti memblokir crawler, keluar dari GitHub, dan mengucilkan pengguna alat AI, justru melewatkan peluang penting
Masalahnya bukan pelatihan, melainkan enclosure
- Masalah yang sebenarnya: bukan sekadar melatih LLM dengan kode kita, melainkan hasilnya diprivatisasi sebagai model proprietari
- Ini bukan masalah baru — inilah masalah yang selama ini diperjuangkan F/OSS
- privatisasi commons
- monopoli atas pengetahuan kolektif
- aliran nilai satu arah dari banyak orang ke segelintir pihak
Pola historis GPL: teknologi baru → eksploitasi baru → lisensi baru
Lisensi F/OSS terus berevolusi mengikuti perubahan teknologi:
- GPLv2 (1991) — mencegah distribusi yang hanya berupa biner → mewajibkan pembukaan source code
- GPLv3 (2007) — mencegah Tivoization (penguncian hardware) → juga mewajibkan informasi instalasi
- AGPL (2007) — menutup celah SaaS → penyediaan melalui jaringan juga dianggap distribusi
Sekarang? Muncul celah pelatihan:
- perusahaan memakai kode F/OSS sebagai data pelatihan untuk model proprietari
- tetapi tidak wajib membuka model ataupun mengungkap sumber pelatihannya
- ini adalah bentuk eksploitasi yang sangat khas — ekstraksi nilai tanpa resiprositas
Solusinya: copyleft pelatihan seperti GPLv4 atau TGPL (Training GPL)
Syarat yang diusulkan:
- pelatihan secara eksplisit diizinkan (selaras dengan prinsip kebebasan F/OSS)
- tetapi model hasilnya harus dibebaskan — bobot harus dibuka dengan lisensi copyleft yang kompatibel
- wajib mendokumentasikan data pelatihan
- model yang di-fine-tune juga mewarisi kewajiban yang sama
- penggunaan melalui jaringan (penyediaan API) juga dianggap distribusi
→ sebagaimana GPLv3 mewajibkan source code untuk biner, copyleft pelatihan akan mewajibkan bobot model untuk sistem yang telah dilatih
Mengapa ini lebih penting daripada mundur
Masalah strategi mundur:
- Menyerahkan medan tempur — OpenAI/Anthropic sudah lebih dulu mengeruk semua yang mereka butuhkan. Yang justru terhalang oleh strategi mundur hanyalah LLM open source seperti Llama/Mistral
- Salah mengidentifikasi masalah — masalahnya bukan teknologinya sendiri, melainkan siapa yang memakainya dan bagaimana cara memakainya
- Memecah komunitas — mengucilkan pengguna “alat yang tidak etis”? Batas penggunaannya sampai mana? Ujian kemurnian seperti ini hanya efektif untuk memecah gerakan
- Meninggalkan strategi inti F/OSS — kejeniusannya GPL adalah bukan melarang penggunaan, melainkan mewajibkan kebebasan diwariskan. Mundur adalah filsafat yang sepenuhnya berlawanan
Perbedaan cara membaca realitas
- antirez (pencipta Redis): LLM tidak bisa dibalikkan → beradaptasi dan percayakan pada persaingan pasar
- penulis artikel asli: perlawanan tetap bermakna → mundur dan blokir akses
- artikel ini: LLM tidak bisa dibalikkan → tetapi siapa yang memilikinya adalah inti masalah
Pertanyaannya bukan apakah kita akan memakai LLM, melainkan:
- siapa yang memiliki model?
- siapa yang memperoleh manfaat dari commons yang dipakai untuk melatih model?
- apakah hasil kontribusi jutaan pengembang F/OSS harus menjadi milik eksklusif segelintir pihak?
→ ini adalah soal apakah buah kerja kolektif tetap tinggal dalam kolektif, atau berubah menjadi properti privat
Sekarang adalah peluang historis
- saat ini sedang berlangsung perbincangan tentang norma yang akan mengatur pelatihan AI dan keterbukaan model
- diskusi komunitas sedang memanas
- di tengah bertambahnya model AI open source, lisensi apa yang akan diterapkan masih belum ditentukan
Jika pengembang F/OSS mundur: lima tahun lagi perusahaan dan pengadilan yang ramah perusahaan akan menetapkan semua norma → celah pelatihan menjadi baku → AI open source akan dirugikan secara permanen
Jika kita ikut terlibat: dorong copyleft pelatihan → buka kode dengan lisensi yang menuntut pembebasan model → kita membentuk masa depan
Kesimpulan dalam satu kalimat
> Bukan memblokir crawler, melainkan mengubah aturan tentang crawling. Bukan menolak LLM, melainkan merebutnya kembali.
→ Sudut pandang materialisme historis: daya produktif baru (LLM) menuntut relasi produksi baru (copyleft pelatihan)
→ Seperti saat Linus merilis Linux dengan GPL dan bukannya berkata “perusahaan tidak boleh memakainya”, melainkan “siapa pun boleh memakainya, tetapi jika ada perbaikan maka bagikanlah”
→ Demi masa depan di mana, sebagaimana kode adalah milik semua orang, model AI yang dilatih darinya juga menjadi milik semua orang
1 komentar
Saya setuju dengan isi tulisannya. Namun, ketika ditanya dari mana, apa, dan sejauh mana kita harus berjuang, rasanya buntu.