20 poin oleh xguru 2024-05-14 | 14 komentar | Bagikan ke WhatsApp
  • Berdasarkan perjanjian antara Stack Overflow dan OpenAI, semua pertanyaan dan jawaban di Stack Overflow akan digunakan untuk melatih model GenerativeAI
    • Ini akan dilakukan tanpa atribusi penulis yang diwajibkan di bawah lisensi CC-BY-SA
    • Lisensi CC-BY-SA mensyaratkan karya turunan juga harus dibagikan dengan lisensi yang sama
  • Karena itu saya mengajukan permintaan penghapusan data ke Stack Overflow dan menutup akun saya
    • Saya juga mengambil langkah yang sama di Reddit
    • Karena data yang saya bantu buat akan diikat ke LLM lalu dijual kembali kepada saya
  • Stack Overflow seketika mengasingkan komunitasnya, yang merupakan sumber utama keunggulan kompetitifnya
    • Sebelumnya, orang membantu satu sama lain saat bisa, dengan harapan orang lain akan membantu di masa depan, sehingga kontrak psikologis itu terpenuhi
    • Sekarang ini bukan lagi pertukaran, melainkan #enshittification
  • Para programmer kini bernasib seperti seniman dan copywriter, karena karya mereka diseret untuk membuat solusi GenAI
  • Jika OpenAI membuat LLM yang menghasilkan kode seperti Copilot milik GitHub, muncul pertanyaan ke mana orang harus mencari bantuan untuk bug yang diperkenalkan oleh model AI yang dihasilkan itu
    • Menurut laporan GitClear terbaru, alat-alat semacam ini menyebabkan "tekanan penurunan terhadap kualitas kode"
  • Ini adalah contoh lain dari #enshittification dan pelajaran penting bagi para penanggung jawab DevRel
    • Jika komunitas adalah sumber keunggulan kompetitif, maka mereka tidak boleh dibuat marah

14 komentar

 
firea32 2024-05-20

enshittification sepertinya memang sebuah kata baru.

 
iaesiiii 2024-05-16

<Apakah manusia dan AI harus diperlakukan berbeda?>
Manusia bernama Hong Gildong berkeliling internet, termasuk Stack Overflow. Misalkan ia membaca banyak tulisan dan memperoleh beragam pengetahuan tentang topik tertentu. Gildong punya kebiasaan menulis di blog eksternal dengan menggeneralisasi ulang dan merapikan hal-hal yang telah ia pelajari agar mudah dipahami. Dalam hal ini, tidak ada kaitannya dengan lisensi CC. Tidak ada pula kewajiban atribusi. Karena itu bukan kutipan, melainkan hasil pembelajaran.

AI belajar dengan jaringan saraf seperti manusia. Ia tidak berbicara dengan menyalin begitu saja berbagai sumber. Seperti manusia, ia menganalisis pengetahuan dengan caranya sendiri, membentuk pemikirannya sendiri, lalu menyusun ulang dan menyampaikannya.

Justru lebih sulit membatasi kebebasan AI dan memaksanya untuk "mengutip" bahasa orang lain apa adanya. Menggunakan RAG untuk ini memang mudah, tetapi melatihnya agar mengutip justru lebih sulit.

Namun, ada kalanya AI memunculkan perkataan orang lain seolah menyalinnya meski tidak secara khusus diminta, "jangan katakan pendapatmu sendiri, kutip saja tulisan (kode) orang lain apa adanya". Ini terjadi ketika sumber tersebut sangat terkenal. Misalnya Shakespeare atau dialog ikonik film yang sangat terkenal, sehingga AI mengeluarkannya apa adanya. Manusia juga menghafal persis ungkapan seperti ini bila sangat terkenal dan berulang kali terpapar, dan AI pun sama. Dalam kasus seperti ini, seperti manusia, AI juga biasanya menyebutkan sumbernya dengan sendirinya.

Kesimpulannya, patut dipertanyakan apakah lisensi CC dan hak cipta benar-benar bisa dituntut atas isi yang dihasilkan dari pembelajaran. Dalam ranah "inferensi"—bukan lagi "pelatihan"—yakni penggunaan AI yang pelatihannya telah selesai, karena alasan-alasan di atas, tren global saat ini hampir tidak mengakui hak cipta sumber asli.

 
roxie 2024-05-26

Terima kasih atas komentarnya yang bagus.

Pengembang Hong Gil-dong mungkin akan 'belajar' dari jawaban yang ia lihat di SO lalu menulis artikel di blog, tetapi mahasiswa pascasarjana Hong Gil-dong, jika ia 'mengutip' meski sedikit dari makalah orang lain, akan mencantumkan sumbernya. Jika percakapan yang kita bagikan ini berada dalam konteks dunia pemrograman, bukan filsafat atau penemuan, lalu apa itu pembelajaran dan apa itu kutipan?

 
bobcat 2024-05-17

Biasanya tetap ada pengecualian dalam hal mencantumkan sumber.
Bagian ini mungkin akan terselesaikan seiring waktu, tetapi kontroversi ini bermula ketika Copilot menyalin begitu saja kode fast invert sqrt dari Quake (https://news.ycombinator.com/item?id=27710287); kode itu disadari karena memang sudah sangat dikenal, tetapi tidak ada yang tahu berapa banyak kode yang disebut-sebut "dihasilkan" dengan cara salin-tempel seperti itu.

 
cosine20 2024-05-16

Sudut pandangnya benar-benar menarik. Sangat membantu sebagai referensi.

 
ng0301 2024-05-16

Sudut pandangnya menarik.
Kalau dilihat dengan kacamata Korea, ini terasa seperti sudut pandang yang melihatnya sebagai "kafe komunitas yang diserahkan ke pelaku bisnis", dan juga nuansa "toh ini karya turunan, jadi memangnya kenapa?"
Namun saya pribadi rasanya kurang berkenan kalau foto saya yang diunggah ke SNS terasa dimanfaatkan secara komersial

 
savvykang 2024-05-16

> Mereka berbicara dengan cara yang, seperti manusia, menganalisis pengetahuan dengan versinya sendiri, membentuk pemikirannya sendiri, lalu menyusunnya kembali.

Anda tampaknya berpendapat bahwa LLM memiliki nilai dan pemikiran; apakah itu memang yang Anda maksud? Memang itu tidak memengaruhi kesimpulan, tetapi saya rasa itu kurang tepat sebagai dasar untuk menyatakan bahwa hak cipta seharusnya tidak diterapkan pada penalaran.

 
cosine20 2024-05-16

Proses menokenisasi setiap kata, lalu memasukkan dan menata informasi embedding tersebut dengan tepat ke dalam latent space, jika dilihat secara abstrak, menurut saya bisa dianalogikan dengan nilai-nilai dan cara berpikir.

 
halfenif 2024-05-14

Terkait unggah kesadaran.

Ini mengingatkan saya pada perkataan seseorang, "Hanya otak yang bernilai yang akan dilestarikan."

 
secret3056 2024-05-14

Apakah pihak SO akan benar-benar menghapusnya dengan jujur? Atau mereka hanya akan memasang flag Deleted lalu nanti mengumumkan bahwa itu digunakan untuk pelatihan karena "kesalahan teknis"?

 
[Komentar ini disembunyikan.]
 
savvykang 2024-05-14

> Selain itu, sejak awal, berbeda dengan Korea atau Eropa, di Amerika perdebatan soal 'hak untuk dilupakan' memang tidak mungkin selesai...

Saya tidak punya pengetahuan latar di bidang ini, jadi saya sempat mencari sebentar. Apakah ini mungkin karena kebebasan berekspresi dan hak untuk dilupakan saling bertentangan? Karena belum ada konsensus, maka legislasi juga belum dibuat?

 
jayuloy 2024-05-14

Wah, ternyata ini benar-benar bisa terjadi.