Model bahasa besar menurunkan berbagi pengetahuan publik di platform tanya jawab online
(academic.oup.com)Ringkasan
-
Dampak model bahasa besar (LLM)
Model bahasa besar (LLM) memiliki potensi untuk menggantikan data dan sumber pengetahuan yang dihasilkan manusia. Namun, penggantian ini dapat menimbulkan masalah karena berujung pada berkurangnya data pelatihan yang dibutuhkan untuk pengembangan model di masa depan. Studi ini mendokumentasikan bahwa aktivitas di Stack Overflow menurun seiring peluncuran ChatGPT. -
Dampak ChatGPT
Dalam 6 bulan setelah peluncuran ChatGPT, aktivitas di Stack Overflow turun 25% dibandingkan platform serupa di Rusia dan Tiongkok serta forum matematika. Ini ditafsirkan sebagai batas bawah dari dampak nyata ChatGPT terhadap Stack Overflow. Penurunan lebih besar terlihat pada posting yang terkait dengan bahasa pemrograman yang paling banyak digunakan. -
Efek substitusi LLM
LLM tidak hanya menggantikan konten yang berulang atau berkualitas rendah, tetapi juga konten berkualitas tinggi. Pengguna ChatGPT cenderung lebih kecil kemungkinannya untuk memposting di Stack Overflow dan tidak lagi mengunjungi platform tersebut secara rutin. Ini menunjukkan bahwa adopsi LLM yang cepat dapat mengurangi produksi data publik yang dibutuhkan untuk pelatihan, sehingga berpotensi menimbulkan konsekuensi penting. -
Dampak menurut bahasa pemrograman
Dampak ChatGPT lebih besar pada bahasa yang banyak digunakan seperti Python dan Javascript. Pada bahasa tertentu seperti CUDA, jumlah posting justru meningkat setelah peluncuran ChatGPT. Ini menunjukkan meningkatnya minat terhadap perangkat lunak yang terkait dengan AI.
Ringkasan GN⁺
- Studi ini menyoroti dampak negatif adopsi AI yang cepat terhadap produksi data publik dengan menganalisis pengaruh model bahasa besar seperti ChatGPT pada platform tanya jawab online.
- Seiring meningkatnya penggunaan ChatGPT, aktivitas pada platform seperti Stack Overflow menurun, dan hal ini dapat memengaruhi kualitas data pelatihan untuk model AI di masa depan.
- Perubahan ini dapat berdampak penting pada ekonomi digital dan cara akses informasi, serta menimbulkan kekhawatiran tentang keberlanjutan ekosistem AI.
- Proyek lain dengan fungsi serupa termasuk repositori GitHub yang berkaitan dengan bahasa pemrograman.
1 komentar
Pendapat di Hacker News
Pada akhirnya masalahnya adalah apa yang akan dijadikan dasar oleh LLM. Karena caranya bukan menciptakan informasi baru, melainkan mengulang dan menggabungkan informasi yang sudah ada, kinerjanya turun tajam pada kode yang tidak memiliki cukup sampel publik atau jawaban Stack Overflow/Reddit
Perlu beberapa kali bolak-balik sampai menemukan solusi yang berjalan, tetapi akhirnya berhasil, dan itu membuat saya bertanya-tanya apakah AI berhasil menemukan dan mencerna materi obscure di internet, atau apakah ia memahami dokumentasi yang sulit itu lebih baik daripada saya. Jika yang kedua benar, kebutuhan akan sampel publik mungkin bisa berkurang
Kita sudah condong ke teknologi yang dikuasai LLM, dan keuntungan bisa membuat LLM menyelesaikan 90% masalah lebih besar daripada manfaat bahasa atau framework yang sedikit lebih baik. Saya cukup tidak suka Python sebagai bahasa, tetapi sulit menyangkal bahwa LLM jauh lebih baik di Python dibandingkan banyak bahasa lain
Angkanya saya karang, tetapi bisa dipertahankan: 90% informasi Stack Overflow adalah pengulangan dari manual di suatu tempat. Masalahnya, informasi yang diinginkan sering sulit ditemukan di dalam dokumen terkait, dan meski ditemukan sering sulit dibaca; LLM sangat unggul dalam membaca dan memahami dokumen
Demo teknologi yang langsung membuat seluruh aplikasi hanya dengan satu-dua prompt itu rapuh. Kalau Anda tidak tahu apa yang sedang dilakukan, saat terus menambahkan fitur ia akan terus mengganti cara memanggil API, cara mengelola state, dan library CSS. Misalnya, di file yang sudah punya 3 fungsi native
fetch, tiba-tiba tanpa alasan ia menyarankan memasang dan memakaiaxiosBagian seperti
{/* rest of your functions here*}juga kadang dihapus begitu sajaSetelah beberapa waktu, tampaknya hanya aman dipakai untuk pekerjaan membosankan seperti loop atau
switch, jadi pekerjaan developer tampaknya masih aman untuk sementaraMakalah itu mengatakan LLM sedang mengurangi berbagi pengetahuan publik, dan efeknya bukan sekadar menggantikan konten duplikat, berkualitas rendah, atau level pemula, tetapi argumennya lemah dan efeknya juga tidak sesensasional judulnya
Pertama, untuk uji yang mereka usulkan bahwa LLM menggantikan posting berkualitas rendah, mereka hanya menampilkan Figure 3 dan tidak menyajikan hasil regresi. Sebaliknya, mereka melaporkan uji untuk pembagian pengalaman pengguna yang arbitrer, misalnya menganggap pengguna yang sudah memposting 10 kali sebagai berpengalaman. Saya bertanya-tanya mengapa uji berdasarkan kualitas posting dihilangkan, sementara hasil bucket “pengalaman” yang arbitrer justru ditampilkan
Kedua, Figure 3 sendiri menunjukkan perubahan tren pada pertanyaan bagus dan pertanyaan netral. Pertanyaan bagus sebelumnya menurun lalu menjadi datar, sedangkan pertanyaan netral sebelumnya naik lalu menjadi datar. Pertanyaan buruk terus menurun tanpa perubahan tren yang mencolok. Ini justru mengisyaratkan kesimpulan sebaliknya: LLM memang menggantikan konten berkualitas rendah
Kesimpulannya tampaknya membutuhkan ungkapan yang lebih kuat, sementara riset tidak memberi banyak imbalan untuk hasil yang teliti tetapi tidak mengejutkan. Karena itu terasa muncul judul yang sensasional dan beberapa hasil yang tampaknya dihilangkan
Orang-orang tidak lagi berbagi informasi secara bebas di forum publik seperti dulu, melainkan mundur ke layanan seperti Discord, menggali parit, dan menaikkan jembatan angkat. Sulit juga menyalahkan mereka. Banyak forum dan media sosial semakin mengadopsi desain dan monetisasi yang bermusuhan, sementara AI/LLM merayapi berbagai tempat, menyedot semuanya, lalu menaruhnya di balik paywall dan merusak peluang sumber asli ditemukan lewat pencarian. Algoritma yang dirancang untuk mendorong engagement memperbesar sindiran tajam dan perdebatan. HN belakangan ini adalah pengecualian langka
Pada akhirnya, orang-orang dengan minat atau pengetahuan tertentu berkumpul di komunitas privat dan hanya berbicara di antara mereka, sehingga lingkungan menjadi lebih sulit bagi orang baru yang ingin masuk
Wajar jika orang mengurangi kontribusi gratis ke Stack Overflow. Stack Overflow menjual para kontributornya lewat kontrak API OpenAI dan banyak sekali tulisan blog berlebihan tentang “AI”
Secara pribadi, banyak pertanyaan terkait proyek open source sudah berpindah ke GitHub dan Discord, jadi selain LLM juga ada perpindahan platform
Untuk masalah pemrograman yang lebih umum, saya cenderung mulai dari Gemini. Ia langsung memberi jawaban dengan istilah sesuai masalah saya, sehingga saya tidak perlu berkeliling beberapa halaman dan merangkainya, atau kalaupun salah, sering memberi petunjuk yang lebih baik untuk memulai pencarian. Ini menghemat waktu dari mengklik berkali-kali tulisan Stack Overflow yang judulnya mirip tetapi memiliki perbedaan penting dalam isinya
2024: Discord bagus karena tidak diindeks generator sampah AI
Saya berlangganan beberapa subreddit teknologi, dan selama dua tahun terakhir saya sering melihat pertanyaan yang sama disebar ke banyak subreddit. Biasanya akunnya baru dibuat, atau semua balasannya berupa respons satu baris generik yang terlihat seperti dihasilkan otomatis.
Saya menganggapnya sebagai akun bot untuk pelatihan AI, dan sebelum menulis penjelasan teknis yang panjang, saya baru menjawab setelah memastikan dulu apakah yang bertanya benar-benar manusia.
Pada akhirnya, keberhasilan “budaya pemberian” lewat WWW, “pengetahuan harus bebas”, F/OSS, dan semacamnya tampaknya akan membuat keseluruhan etika peretas ala Stallman terlihat buruk.
Kita semua bekerja untuk IBM^H^H^HOpenAI, tetapi kini tidak ada lagi sesuatu seperti GPL yang menopang kita.
Jika terasa déjà vu, ini adalah hal yang sudah disorot besar-besaran oleh para pengkritik pada Juli 2023 lewat “Are Large Language Models a Threat to Digital Public Goods? Evidence from Activity on Stack Overflow”: https://arxiv.org/abs/2307.07367
Ini juga dibahas di HN: https://news.ycombinator.com/item?id=36763718
Terkait itu, ada juga https://meta.stackoverflow.com/questions/425635 dan https://meta.stackoverflow.com/questions/422392
Pada akhirnya model bahasa berskala besar akan menjadi akhir dari open source. Terima saja.
Model bahasa berskala besar digunakan untuk mengagregasi dan menginterpolasi kekayaan intelektual. Dalam proses ini tidak ada pengakuan terhadap penulis atau garis keturunan, maupun atribusi atau sitasi. Pada dasarnya, kekayaan intelektual yang dipakai untuk melatih model menjadi milik bersama anonim.
Imbalan sosial yang sering menjadi motivasi kerja open source, misalnya kredit dan penghormatan, akan melemah. Begitulah akhirnya.
Biaya kontribusi turun drastis. Misalnya, dengan 100 dolar Anda mendapat 200 juta token GPT-3.5, yang berarti 10 ribu token untuk mengembangkan setiap baris dalam proyek 20 ribu baris.
Itu proyek skala menengah yang bisa dilakukan dengan satu kali donasi dan setengah sore mengelola framework alur kerja.
Jika LLM adalah akhir dari open source, alasannya adalah persis seperti yang dikatakan: ia mengagregasi dan menginterpolasi kekayaan intelektual, lalu menjadikan kekayaan intelektual yang dilatih tanpa penulis, garis keturunan, atau atribusi sumber sebagai milik bersama anonim.
Namun jika ini benar dan terus diizinkan, semua kekayaan intelektual yang bergantung pada hak cipta akan terancam dengan cara yang sama. Ini bukan masalah yang unik untuk open source. Jika maksudnya karya non-open-source terlindungi dengan menjaga “source” atau padanannya tetap rahasia, saya tidak tahu bagaimana menghasilkan uang dari film blockbuster yang tidak boleh diperlihatkan kepada siapa pun, atau novel yang harus dibuat agar tidak ada yang bisa membacanya.
Kredit dan penghormatan bukan satu-satunya motivasi untuk kerja open source, dan saya juga ragu apakah itu motivasi yang paling umum. Imbalan seperti itu lebih mirip citra yang ingin digambarkan oleh pihak-pihak yang mencoba menjadikan open source seperti jejaring sosial atau menggamifikasikannya.
Juga tidak jelas mengapa hal-hal semacam itu harus hilang. Penemuan kamera tidak menghilangkan kenikmatan artistik para pelukis potret. Motivasi yang murni finansial memang bisa terpukul, tetapi itu jauh dari motivasi yang khusus unik untuk open source.
Upaya mempertahankan korpus teks buatan manusia yang kini bernilai untuk pelatihan LLM sebagai taman tertutup adalah pertarungan yang pasti kalah. Besar kemungkinan kudanya sudah telanjur keluar dari kandang
Namun saya melihat ini sebagai masalah sementara. LLM adalah teknologi transisional. Suatu saat, tidak perlu lagi melatih model dengan seluruh Reddit dan semua hal yang pernah ditulis secara utuh. Model statistik seperti ini punya batasan yang jelas, dan manusia tidak belajar dengan cara begitu. Seumur hidup, seseorang mungkin membaca ratusan, bahkan mungkin ribuan buku, tetapi tidak membaca sejuta buku, dan itu pun tidak perlu
Yang menarik, meski isu ini jelas merupakan pencurian, ia diperlakukan sebagai pencurian dari situs atau perusahaan yang “memiliki” data tersebut, bukan sebagai pencurian dari pengguna yang membuatnya. Situs-situs konten buatan pengguna pada akhirnya ditakdirkan gagal. Insentif mereka tidak selaras dengan pengguna, dan pengejaran laba tanpa akhir pada akhirnya pasti membuat pengguna pergi
Masalah lain adalah seberapa banyak kekayaan intelektual harus dikonsumsi sebelum bisa disebut pencurian. Jika LLM menonton semua film yang pernah dibuat, itu mungkin pencurian. Tetapi mulai dari berapa film hal itu menjadi terlalu banyak? Apocalypse Now secara longgar didasarkan pada atau terinspirasi oleh Heart of Darkness, tetapi kita tidak bisa menyebut manusia yang membaca Heart of Darkness sebagai “pencuri”
Seperti kata orang, semua seni bersifat turunan
Ia bisa membuat puisi dan sastra, serta menghasilkan jawaban untuk kode, fisika, dan perbaikan mobil dengan cara yang serupa. Manusia dengan kemampuan seperti itu sekarang sangat langka
Jadi saya setuju bahwa LLM bersifat transisional, tetapi dalam arti yang mirip dengan transisionalitas otak dari ganglia basal ke neokorteks. Otak AI umum di masa depan kemungkinan besar akan mencakup LLM bersama unsur-unsur lain, tetapi belum jelas apakah ia pasti akan berevolusi agar bekerja seperti otak manusia
LLM bisa mempelajari dokumentasi resmi suatu alat atau library, tetapi tidak bisa melakukan eksperimen langsung untuk menemukan solusi atas masalah-masalah aneh yang begitu umum di industri teknologi. Jika orang-orang berhenti saling berbagi solusi seperti itu, ini bisa menjadi masalah besar
Misalnya, saya penasaran apakah kita bisa melatih AI dengan reinforcement learning dan generative adversarial network untuk melakukan tugas IT berdasarkan sekumpulan dokumen, lalu mengukur fitness-nya bukan hanya dari keberhasilan langsung tugas tersebut, tetapi juga dari kemampuannya menghasilkan dokumen baru yang lebih tersaring, yang membuat salinan dirinya sendiri tanpa konteks apa pun juga mampu melakukan tugas itu dengan baik
Mendengar berbagai guru spiritual berbeda mengungkapkan hal yang sama dengan kata-kata berbeda itu mirip melihat potongan-potongan kaca berwarna yang sama dalam kaleidoskop disusun ulang menjadi pola baru
Jadi jika AI masa depan juga dipakai seperti ChatGPT sekarang, tempat orang-orang kebanyakan meminta saran tentang hampir apa saja, menurut saya pada akhirnya ia memang harus membaca semuanya
Orang tidak akan menulis di tempat yang tidak mereka kunjungi
Alasan orang tidak mengunjungi Stack Overflow untuk materi yang sudah dikenal, terutama bahasa pemrograman populer, adalah karena perplexity.ai, ChatGPT, Claude, dan lainnya bukan hanya menjawab pertanyaan lebih baik daripada membaca halaman Stack Overflow, tetapi juga membuat jawaban—benar atau salah—lebih cepat untuk disalin dan ditempel
Jika orang tidak berada di Stack Overflow untuk bertanya, mereka juga tidak akan menjawab di sana. Tidak perlu alasan lain untuk menjelaskan pengamatan ini
Tentu saja, ini berarti agar Stack Overflow dan forum Q&A lain bisa bersaing, mereka harus memprioritaskan kegunaan jawaban, yaitu kemudahan mengintegrasikan jawaban ke dalam alur kerja
AI tidak “menjawab pertanyaan dengan lebih baik”. Ia hanya memangkas tahap perantara berupa menafsirkan pertanyaan dan mencocokkannya dengan kata-kata yang berbentuk jawaban. Ia sering berhalusinasi, dan nyaris tidak melakukan pemeriksaan kewajaran atas apa yang ingin dilakukan pengguna
Alasan utama keunggulannya dalam kecepatan dan kenyamanan dibanding forum Q&A adalah karena ia sama sekali tidak peduli apakah pertanyaan dan jawaban itu nantinya dapat membantu orang lain. Ia tidak mempertimbangkan tuntutan agar dapat ditemukan lewat mesin pencari, dapat dipahami orang lain sebagai pertanyaan yang sama, dan harus berfokus pada satu isu
Sejak awal ia tidak dirancang untuk itu, dan tidak punya kepentingan untuk melakukannya. Jika orang berikutnya bertanya, ia tinggal menghasilkan lagi isi jawaban yang sama dengan cara berkualitas rendah lainnya. Berbeda dari pakar manusia, AI tidak lelah melakukan pekerjaan itu