Model bahasa besar menurunkan berbagi pengetahuan publik di platform tanya jawab online

(academic.oup.com)

2 poin oleh GN⁺ 2024-10-14 | 1 komentar | Bagikan ke WhatsApp

Ringkasan

Dampak model bahasa besar (LLM)
Model bahasa besar (LLM) memiliki potensi untuk menggantikan data dan sumber pengetahuan yang dihasilkan manusia. Namun, penggantian ini dapat menimbulkan masalah karena berujung pada berkurangnya data pelatihan yang dibutuhkan untuk pengembangan model di masa depan. Studi ini mendokumentasikan bahwa aktivitas di Stack Overflow menurun seiring peluncuran ChatGPT.
Dampak ChatGPT
Dalam 6 bulan setelah peluncuran ChatGPT, aktivitas di Stack Overflow turun 25% dibandingkan platform serupa di Rusia dan Tiongkok serta forum matematika. Ini ditafsirkan sebagai batas bawah dari dampak nyata ChatGPT terhadap Stack Overflow. Penurunan lebih besar terlihat pada posting yang terkait dengan bahasa pemrograman yang paling banyak digunakan.
Efek substitusi LLM
LLM tidak hanya menggantikan konten yang berulang atau berkualitas rendah, tetapi juga konten berkualitas tinggi. Pengguna ChatGPT cenderung lebih kecil kemungkinannya untuk memposting di Stack Overflow dan tidak lagi mengunjungi platform tersebut secara rutin. Ini menunjukkan bahwa adopsi LLM yang cepat dapat mengurangi produksi data publik yang dibutuhkan untuk pelatihan, sehingga berpotensi menimbulkan konsekuensi penting.
Dampak menurut bahasa pemrograman
Dampak ChatGPT lebih besar pada bahasa yang banyak digunakan seperti Python dan Javascript. Pada bahasa tertentu seperti CUDA, jumlah posting justru meningkat setelah peluncuran ChatGPT. Ini menunjukkan meningkatnya minat terhadap perangkat lunak yang terkait dengan AI.

Ringkasan GN⁺

Studi ini menyoroti dampak negatif adopsi AI yang cepat terhadap produksi data publik dengan menganalisis pengaruh model bahasa besar seperti ChatGPT pada platform tanya jawab online.
Seiring meningkatnya penggunaan ChatGPT, aktivitas pada platform seperti Stack Overflow menurun, dan hal ini dapat memengaruhi kualitas data pelatihan untuk model AI di masa depan.
Perubahan ini dapat berdampak penting pada ekonomi digital dan cara akses informasi, serta menimbulkan kekhawatiran tentang keberlanjutan ekosistem AI.
Proyek lain dengan fungsi serupa termasuk repositori GitHub yang berkaitan dengan bahasa pemrograman.

1 komentar

GN⁺ 2024-10-14

Pendapat di Hacker News

Pada akhirnya masalahnya adalah apa yang akan dijadikan dasar oleh LLM. Karena caranya bukan menciptakan informasi baru, melainkan mengulang dan menggabungkan informasi yang sudah ada, kinerjanya turun tajam pada kode yang tidak memiliki cukup sampel publik atau jawaban Stack Overflow/Reddit
- Sebagai catatan, GPT o1 membantu menyelesaikan kasus penggunaan yang cukup rumit untuk epub.js, sebuah library open source dengan dokumentasi yang tidak transparan dan contoh publik yang sedikit
  Perlu beberapa kali bolak-balik sampai menemukan solusi yang berjalan, tetapi akhirnya berhasil, dan itu membuat saya bertanya-tanya apakah AI berhasil menemukan dan mencerna materi obscure di internet, atau apakah ia memahami dokumentasi yang sulit itu lebih baik daripada saya. Jika yang kedua benar, kebutuhan akan sampel publik mungkin bisa berkurang
- Mungkin ada efek samping menarik: karena LLM tidak mengetahuinya, orang-orang bisa jadi lebih jarang membuat bahasa pemrograman dan framework baru secara sembarangan
  Kita sudah condong ke teknologi yang dikuasai LLM, dan keuntungan bisa membuat LLM menyelesaikan 90% masalah lebih besar daripada manfaat bahasa atau framework yang sedikit lebih baik. Saya cukup tidak suka Python sebagai bahasa, tetapi sulit menyangkal bahwa LLM jauh lebih baik di Python dibandingkan banyak bahasa lain
- Berbeda dengan klaim “tidak menciptakan informasi baru”, sebagian besar berbagi pengetahuan di platform Q&A online bukanlah aktivitas kreatif. Selain pengembang sistem itu sendiri, ini lebih mirip pertanyaan tanpa akhir tentang masalah yang sama yang dialami semua orang, dan sebagian besar sebenarnya menggantikan platform pencarian
- Yang bisa dijadikan dasar oleh LLM adalah dokumentasi resmi
  Angkanya saya karang, tetapi bisa dipertahankan: 90% informasi Stack Overflow adalah pengulangan dari manual di suatu tempat. Masalahnya, informasi yang diinginkan sering sulit ditemukan di dalam dokumen terkait, dan meski ditemukan sering sulit dibaca; LLM sangat unggul dalam membaca dan memahami dokumen
- LLM bolak-balik secara serampangan antara cara lama dan cara baru, dan semakin besar kode spaghetti LLM, semakin tidak mampu ia menambahkan fitur secara presisi tanpa merusak logika yang sudah ada
  Demo teknologi yang langsung membuat seluruh aplikasi hanya dengan satu-dua prompt itu rapuh. Kalau Anda tidak tahu apa yang sedang dilakukan, saat terus menambahkan fitur ia akan terus mengganti cara memanggil API, cara mengelola state, dan library CSS. Misalnya, di file yang sudah punya 3 fungsi native fetch, tiba-tiba tanpa alasan ia menyarankan memasang dan memakai axios
  Bagian seperti {/* rest of your functions here*} juga kadang dihapus begitu saja
  Setelah beberapa waktu, tampaknya hanya aman dipakai untuk pekerjaan membosankan seperti loop atau switch, jadi pekerjaan developer tampaknya masih aman untuk sementara
Makalah itu mengatakan LLM sedang mengurangi berbagi pengetahuan publik, dan efeknya bukan sekadar menggantikan konten duplikat, berkualitas rendah, atau level pemula, tetapi argumennya lemah dan efeknya juga tidak sesensasional judulnya
Pertama, untuk uji yang mereka usulkan bahwa LLM menggantikan posting berkualitas rendah, mereka hanya menampilkan Figure 3 dan tidak menyajikan hasil regresi. Sebaliknya, mereka melaporkan uji untuk pembagian pengalaman pengguna yang arbitrer, misalnya menganggap pengguna yang sudah memposting 10 kali sebagai berpengalaman. Saya bertanya-tanya mengapa uji berdasarkan kualitas posting dihilangkan, sementara hasil bucket “pengalaman” yang arbitrer justru ditampilkan
Kedua, Figure 3 sendiri menunjukkan perubahan tren pada pertanyaan bagus dan pertanyaan netral. Pertanyaan bagus sebelumnya menurun lalu menjadi datar, sedangkan pertanyaan netral sebelumnya naik lalu menjadi datar. Pertanyaan buruk terus menurun tanpa perubahan tren yang mencolok. Ini justru mengisyaratkan kesimpulan sebaliknya: LLM memang menggantikan konten berkualitas rendah
Kesimpulannya tampaknya membutuhkan ungkapan yang lebih kuat, sementara riset tidak memberi banyak imbalan untuk hasil yang teliti tetapi tidak mengejutkan. Karena itu terasa muncul judul yang sensasional dan beberapa hasil yang tampaknya dihilangkan
- Ini bukan persis topik yang dibahas tulisan ini, tetapi dulu di HN ada seseorang yang menggambarkan fenomena serupa dengan baik. Internet sedang mengalami balkanisasi. Ini bukan konsep baru, tetapi sangat cocok jika difokuskan pada komunitas online
  Orang-orang tidak lagi berbagi informasi secara bebas di forum publik seperti dulu, melainkan mundur ke layanan seperti Discord, menggali parit, dan menaikkan jembatan angkat. Sulit juga menyalahkan mereka. Banyak forum dan media sosial semakin mengadopsi desain dan monetisasi yang bermusuhan, sementara AI/LLM merayapi berbagai tempat, menyedot semuanya, lalu menaruhnya di balik paywall dan merusak peluang sumber asli ditemukan lewat pencarian. Algoritma yang dirancang untuk mendorong engagement memperbesar sindiran tajam dan perdebatan. HN belakangan ini adalah pengecualian langka
  Pada akhirnya, orang-orang dengan minat atau pengetahuan tertentu berkumpul di komunitas privat dan hanya berbicara di antara mereka, sehingga lingkungan menjadi lebih sulit bagi orang baru yang ingin masuk
- Jika LLM cukup baik membantu coder sehingga orang menghabiskan lebih sedikit waktu di Stack Overflow, dan sebagai gantinya mendorong lebih banyak kode open source, itu mungkin lebih bernilai bagi semua orang
Wajar jika orang mengurangi kontribusi gratis ke Stack Overflow. Stack Overflow menjual para kontributornya lewat kontrak API OpenAI dan banyak sekali tulisan blog berlebihan tentang “AI”
- Saya rasa itu bukan alasan utamanya. Orang-orang tidak terlalu peduli jika seseorang menjual apa yang mereka buat di sebuah platform. Media sosial besar seperti Facebook telah melakukan itu selama bertahun-tahun, tetapi tetap digunakan. Orang datang ke Stack Overflow untuk mendapatkan jawaban; mengapa mereka harus peduli jika kelak seseorang melatih LLM dengan jawaban itu
- Ini tampaknya lebih dekat ke penurunan pertanyaan daripada penurunan jawaban
- Periode analisisnya sampai Mei 2023, jadi setahun sebelum kontrak OpenAI. Kontrak itu tidak terkait dengan hasil makalah
- Ini merupakan tambahan di atas tren jangka panjang yang sudah berlangsung sejak sekitar 2014. Keluhan terus meningkat tentang kualitas dan sifat pertanyaan, yaitu pertanyaan yang tidak mengikuti pedoman situs dan juga kurang menunjukkan upaya untuk memahami bagaimana situs seharusnya bekerja
Secara pribadi, banyak pertanyaan terkait proyek open source sudah berpindah ke GitHub dan Discord, jadi selain LLM juga ada perpindahan platform
Untuk masalah pemrograman yang lebih umum, saya cenderung mulai dari Gemini. Ia langsung memberi jawaban dengan istilah sesuai masalah saya, sehingga saya tidak perlu berkeliling beberapa halaman dan merangkainya, atau kalaupun salah, sering memberi petunjuk yang lebih baik untuk memulai pencarian. Ini menghemat waktu dari mengklik berkali-kali tulisan Stack Overflow yang judulnya mirip tetapi memiliki perbedaan penting dalam isinya
- 2022: Discord kurang bagus karena tidak diindeks mesin pencari
  2024: Discord bagus karena tidak diindeks generator sampah AI
- Pengalaman saya sepenuhnya sama bahwa pertanyaan proyek open source berpindah ke GitHub dan Discord. Selain itu, menyenangkan karena bisa berbicara langsung dengan maintainer
Saya berlangganan beberapa subreddit teknologi, dan selama dua tahun terakhir saya sering melihat pertanyaan yang sama disebar ke banyak subreddit. Biasanya akunnya baru dibuat, atau semua balasannya berupa respons satu baris generik yang terlihat seperti dihasilkan otomatis.
Saya menganggapnya sebagai akun bot untuk pelatihan AI, dan sebelum menulis penjelasan teknis yang panjang, saya baru menjawab setelah memastikan dulu apakah yang bertanya benar-benar manusia.
- Bagaimanapun, itu tetap membantu pelatihan.
  Pada akhirnya, keberhasilan “budaya pemberian” lewat WWW, “pengetahuan harus bebas”, F/OSS, dan semacamnya tampaknya akan membuat keseluruhan etika peretas ala Stallman terlihat buruk.
  Kita semua bekerja untuk IBM^H^H^HOpenAI, tetapi kini tidak ada lagi sesuatu seperti GPL yang menopang kita.
Jika terasa déjà vu, ini adalah hal yang sudah disorot besar-besaran oleh para pengkritik pada Juli 2023 lewat “Are Large Language Models a Threat to Digital Public Goods? Evidence from Activity on Stack Overflow”: https://arxiv.org/abs/2307.07367
Ini juga dibahas di HN: https://news.ycombinator.com/item?id=36763718
- Diskusi meta Stack Overflow sendiri tentang ini juga layak dibaca: https://meta.stackoverflow.com/questions/425651
  Terkait itu, ada juga https://meta.stackoverflow.com/questions/425635 dan https://meta.stackoverflow.com/questions/422392
Pada akhirnya model bahasa berskala besar akan menjadi akhir dari open source. Terima saja.
Model bahasa berskala besar digunakan untuk mengagregasi dan menginterpolasi kekayaan intelektual. Dalam proses ini tidak ada pengakuan terhadap penulis atau garis keturunan, maupun atribusi atau sitasi. Pada dasarnya, kekayaan intelektual yang dipakai untuk melatih model menjadi milik bersama anonim.
Imbalan sosial yang sering menjadi motivasi kerja open source, misalnya kredit dan penghormatan, akan melemah. Begitulah akhirnya.
- Mengapa tidak menulis lebih banyak open source dengan LLM?
  Biaya kontribusi turun drastis. Misalnya, dengan 100 dolar Anda mendapat 200 juta token GPT-3.5, yang berarti 10 ribu token untuk mengembangkan setiap baris dalam proyek 20 ribu baris.
  Itu proyek skala menengah yang bisa dilakukan dengan satu kali donasi dan setengah sore mengelola framework alur kerja.
- Saya tidak memahami sudut pandang ini.
  Jika LLM adalah akhir dari open source, alasannya adalah persis seperti yang dikatakan: ia mengagregasi dan menginterpolasi kekayaan intelektual, lalu menjadikan kekayaan intelektual yang dilatih tanpa penulis, garis keturunan, atau atribusi sumber sebagai milik bersama anonim.
  Namun jika ini benar dan terus diizinkan, semua kekayaan intelektual yang bergantung pada hak cipta akan terancam dengan cara yang sama. Ini bukan masalah yang unik untuk open source. Jika maksudnya karya non-open-source terlindungi dengan menjaga “source” atau padanannya tetap rahasia, saya tidak tahu bagaimana menghasilkan uang dari film blockbuster yang tidak boleh diperlihatkan kepada siapa pun, atau novel yang harus dibuat agar tidak ada yang bisa membacanya.
  Kredit dan penghormatan bukan satu-satunya motivasi untuk kerja open source, dan saya juga ragu apakah itu motivasi yang paling umum. Imbalan seperti itu lebih mirip citra yang ingin digambarkan oleh pihak-pihak yang mencoba menjadikan open source seperti jejaring sosial atau menggamifikasikannya.
  Juga tidak jelas mengapa hal-hal semacam itu harus hilang. Penemuan kamera tidak menghilangkan kenikmatan artistik para pelukis potret. Motivasi yang murni finansial memang bisa terpukul, tetapi itu jauh dari motivasi yang khusus unik untuk open source.
- Bukan begitu; itu hanya akan membuat open source yang sudah cukup niche menjadi lebih niche lagi
Upaya mempertahankan korpus teks buatan manusia yang kini bernilai untuk pelatihan LLM sebagai taman tertutup adalah pertarungan yang pasti kalah. Besar kemungkinan kudanya sudah telanjur keluar dari kandang
Namun saya melihat ini sebagai masalah sementara. LLM adalah teknologi transisional. Suatu saat, tidak perlu lagi melatih model dengan seluruh Reddit dan semua hal yang pernah ditulis secara utuh. Model statistik seperti ini punya batasan yang jelas, dan manusia tidak belajar dengan cara begitu. Seumur hidup, seseorang mungkin membaca ratusan, bahkan mungkin ribuan buku, tetapi tidak membaca sejuta buku, dan itu pun tidak perlu
Yang menarik, meski isu ini jelas merupakan pencurian, ia diperlakukan sebagai pencurian dari situs atau perusahaan yang “memiliki” data tersebut, bukan sebagai pencurian dari pengguna yang membuatnya. Situs-situs konten buatan pengguna pada akhirnya ditakdirkan gagal. Insentif mereka tidak selaras dengan pengguna, dan pengejaran laba tanpa akhir pada akhirnya pasti membuat pengguna pergi
Masalah lain adalah seberapa banyak kekayaan intelektual harus dikonsumsi sebelum bisa disebut pencurian. Jika LLM menonton semua film yang pernah dibuat, itu mungkin pencurian. Tetapi mulai dari berapa film hal itu menjadi terlalu banyak? Apocalypse Now secara longgar didasarkan pada atau terinspirasi oleh Heart of Darkness, tetapi kita tidak bisa menyebut manusia yang membaca Heart of Darkness sebagai “pencuri”
Seperti kata orang, semua seni bersifat turunan
- Saya setuju, tetapi mungkin kita terlalu mengistimewakan cara kerja kecerdasan manusia. LLM adalah polymath yang memuntahkan konten dengan kecepatan supermanusia
  Ia bisa membuat puisi dan sastra, serta menghasilkan jawaban untuk kode, fisika, dan perbaikan mobil dengan cara yang serupa. Manusia dengan kemampuan seperti itu sekarang sangat langka
  Jadi saya setuju bahwa LLM bersifat transisional, tetapi dalam arti yang mirip dengan transisionalitas otak dari ganglia basal ke neokorteks. Otak AI umum di masa depan kemungkinan besar akan mencakup LLM bersama unsur-unsur lain, tetapi belum jelas apakah ia pasti akan berevolusi agar bekerja seperti otak manusia
- Forum online terkadang satu-satunya tempat untuk menemukan solusi bagi situasi niche dan edge case. Itu adalah kiat-kiat yang akan sangat sulit ditemukan sendiri
  LLM bisa mempelajari dokumentasi resmi suatu alat atau library, tetapi tidak bisa melakukan eksperimen langsung untuk menemukan solusi atas masalah-masalah aneh yang begitu umum di industri teknologi. Jika orang-orang berhenti saling berbagi solusi seperti itu, ini bisa menjadi masalah besar
- Akhir-akhir ini saya banyak memikirkan poin bahwa “manusia tidak belajar dengan cara begitu”
  Misalnya, saya penasaran apakah kita bisa melatih AI dengan reinforcement learning dan generative adversarial network untuk melakukan tugas IT berdasarkan sekumpulan dokumen, lalu mengukur fitness-nya bukan hanya dari keberhasilan langsung tugas tersebut, tetapi juga dari kemampuannya menghasilkan dokumen baru yang lebih tersaring, yang membuat salinan dirinya sendiri tanpa konteks apa pun juga mampu melakukan tugas itu dengan baik
- Kalau memikirkan buku seperti “Finite and Infinite Games”, saya rasa hanya dari membaca bidang-bidang lain pun seseorang bisa “merekonstruksi” sebagian pengetahuan dan argumen inti buku itu
  Mendengar berbagai guru spiritual berbeda mengungkapkan hal yang sama dengan kata-kata berbeda itu mirip melihat potongan-potongan kaca berwarna yang sama dalam kaleidoskop disusun ulang menjadi pola baru
- Setengah benar. Penalaran dan pemahaman nyata mungkin bukan kekuatan LLM, tetapi menarik bahwa ia bisa menghasilkan informasi yang baik dari semua hal yang pernah dibacanya. Saya hanya membaca sebagian sangat kecil dari semua itu. Ia mungkin bodoh, tetapi daya ingatnya bagus
  Jadi jika AI masa depan juga dipakai seperti ChatGPT sekarang, tempat orang-orang kebanyakan meminta saran tentang hampir apa saja, menurut saya pada akhirnya ia memang harus membaca semuanya
Orang tidak akan menulis di tempat yang tidak mereka kunjungi
Alasan orang tidak mengunjungi Stack Overflow untuk materi yang sudah dikenal, terutama bahasa pemrograman populer, adalah karena perplexity.ai, ChatGPT, Claude, dan lainnya bukan hanya menjawab pertanyaan lebih baik daripada membaca halaman Stack Overflow, tetapi juga membuat jawaban—benar atau salah—lebih cepat untuk disalin dan ditempel
Jika orang tidak berada di Stack Overflow untuk bertanya, mereka juga tidak akan menjawab di sana. Tidak perlu alasan lain untuk menjelaskan pengamatan ini
Tentu saja, ini berarti agar Stack Overflow dan forum Q&A lain bisa bersaing, mereka harus memprioritaskan kegunaan jawaban, yaitu kemudahan mengintegrasikan jawaban ke dalam alur kerja
- Bersaing dengan AI adalah non-tujuan yang secara eksplisit dinyatakan oleh komunitas Stack Overflow dan forum Q&A lain yang saya gunakan, Codidact
  AI tidak “menjawab pertanyaan dengan lebih baik”. Ia hanya memangkas tahap perantara berupa menafsirkan pertanyaan dan mencocokkannya dengan kata-kata yang berbentuk jawaban. Ia sering berhalusinasi, dan nyaris tidak melakukan pemeriksaan kewajaran atas apa yang ingin dilakukan pengguna
  Alasan utama keunggulannya dalam kecepatan dan kenyamanan dibanding forum Q&A adalah karena ia sama sekali tidak peduli apakah pertanyaan dan jawaban itu nantinya dapat membantu orang lain. Ia tidak mempertimbangkan tuntutan agar dapat ditemukan lewat mesin pencari, dapat dipahami orang lain sebagai pertanyaan yang sama, dan harus berfokus pada satu isu
  Sejak awal ia tidak dirancang untuk itu, dan tidak punya kepentingan untuk melakukannya. Jika orang berikutnya bertanya, ia tinggal menghasilkan lagi isi jawaban yang sama dengan cara berkualitas rendah lainnya. Berbeda dari pakar manusia, AI tidak lelah melakukan pekerjaan itu

Model bahasa besar menurunkan berbagi pengetahuan publik di platform tanya jawab online

Ringkasan

Ringkasan GN⁺

Bacaan terkait

1 komentar

Pendapat di Hacker News