- Penulisan dengan LLM telah meluas ke blog, media sosial, surat kabar, buku, pemeriksa ejaan, hingga penyusunan draf, dan gaya yang berulang membuat tulisan tampak seragam seperti slop
- Pembaca berharap bahwa sebagaimana mereka meluangkan waktu untuk membaca, penulis juga mencurahkan upaya intelektual; penggunaan LLM menggoyahkan harapan ini terlepas dari kualitas hasilnya
- Oxide RFD 576 berpendapat bahwa keyakinan bahwa penulis benar-benar memahami dan menulis sendiri itulah yang membenarkan upaya pembaca untuk memahami, dan prosa LLM merusak kontrak sosial ini
- Sejak ChatGPT, teks generatif memengaruhi ucapan dan gaya manusia bahkan tanpa ditulis langsung, terlihat dari meningkatnya penggunaan kata seperti “delve”, “realm”, dan “meticulous”
- Standar tulisan yang baik bergeser dari kelengkapan tata bahasa dan kosakata menuju ekspresi yang orisinal serta jejak kemanusiaan, dan salah ketik pun bisa menjadi sinyal pembeda dari teks AI
Penulisan dengan LLM dan kontrak sosial
- LLM telah menyebar ke banyak industri, tetapi khususnya dalam menulis, digunakan secara luas untuk blog, media sosial, surat kabar, buku, pemeriksa ejaan, tata bahasa, pengecekan fakta, hingga penyusunan draf penuh
- LLM sangat kuat untuk membuat konten dalam jumlah besar, tetapi begitu kita mulai mengenali ungkapan dan pola gaya khas LLM, nuansa yang sama terasa berulang di mana-mana
- Ekspresi seperti “it’s not x, it’s why”, em-dash, dan “you’re not imagining it, the problem is real” terus berulang, sehingga tulisan makin terseragamkan menjadi slop yang sama
- Pembaca merasakan penolakan yang kuat ketika menyadari bahwa meskipun mereka meluangkan waktu untuk membaca, penulis tidak menghabiskan waktu yang setara
- Penolakan ini tidak hilang bahkan ketika isinya akurat, diteliti dengan cukup baik, dan tulisannya sendiri cukup bagus
Persoalan yang diajukan Oxide RFD 576
- Bagian 2.4 “LLMs as writers” dari Oxide RFD 576 memandang bahwa prosa yang dihasilkan LLM merusak kontrak sosial dalam menulis
- Sebelum ada LLM, ada asumsi bahwa penulislah yang menanggung upaya intelektual lebih besar dibanding pembaca
- Pembaca punya alasan untuk berusaha memahami kalimat dan gagasan yang sulit jika mereka percaya bahwa penulis benar-benar memahami dan menuliskannya sendiri
- Ketika menulis dengan LLM, terlepas dari kualitas tulisan atau akurasi isinya, upaya yang dikeluarkan penulis untuk membuat konten berkurang
- Masalah intinya bukan hanya kualitas hasil, melainkan bahwa tindakan menggunakan LLM alih-alih menulis sendiri sudah merupakan pelanggaran terhadap kontrak sosial
Pengaruh teks generatif yang sulit dihindari
- Bahkan tanpa menggunakan LLM secara langsung, banjir teks generatif memengaruhi cara manusia berbicara dan menulis
- Ungkapan seperti “you’re absolutely right” memang dipakai untuk mengolok-olok LLM, tetapi alat itu sendiri juga secara halus mengubah kebiasaan berbahasa manusia
- Riset dari Max-Planck Institute for Human Development menganalisis bahwa kata-kata yang disukai ChatGPT kini juga lebih sering muncul dalam bahasa lisan manusia
- Kata-kata yang meningkat pemakaiannya mencakup delve, realm, meticulous, adept, boast, swift, comprehend
- Keluaran AI generatif, terlepas dari dipakai langsung atau tidak, sudah menyebar ke seluruh lingkungan bahasa kita
Analogi baja latar-belakang rendah
- Low-background steel merujuk pada baja yang diproduksi sebelum ledakan bom atom pertama, bahan yang pada suatu masa lebih banyak dicari untuk penggunaan tertentu
- Berbagai uji coba nuklir pada 1940-an hingga 1950-an meningkatkan material radioaktif di atmosfer, dan baja yang diproduksi setelahnya dianggap tidak cukup “bersih” untuk beberapa aplikasi seperti detektor partikel
- Namun kini, karena radiasi latar buatan manusia secara global telah menurun, baja yang diproduksi belakangan tampaknya juga dapat dipakai untuk sebagian besar keperluan
- Dalam analogi ini, tulisan setelah 30 November 2022 dianggap telah ditulis setelah penyebaran ChatGPT dan dengan demikian sedikit banyak dipengaruhi LLM
- Kecuali hanya membaca konten lama, sangat sulit untuk sepenuhnya menghindari lingkungan bahasa pasca-LLM
Standar menulis setelah LLM
- Semakin besar porsi konten generatif di internet, semakin tinggi pula permintaan terhadap pemikiran dan ekspresi yang orisinal baik dari manusia individual maupun perusahaan model
- Kemampuan menulis konten orisinal tanpa LLM bisa menjadi semakin bernilai
- Namun, di lingkungan yang dipenuhi tulisan thought leadership ala LinkedIn dan gambar kucing hasil AI, menemukan tulisan seperti itu justru makin sulit
- Selama ini manusia menganggap tata bahasa yang baik, kosakata yang luas, ekspresi dan metafora yang tepat, serta struktur yang kokoh sebagai standar tulisan yang baik
- LLM umumnya memenuhi standar tradisional ini, tetapi terus mengulang pola yang sama, ekspresinya terasa usang, metaforanya agak janggal, dan em-dash meninggalkan kesan buruk
Perubahan standar tulisan yang baik
- Saat ini, seorang pelajar bisa memilih untuk menulis dengan sungguh-sungguh demi nilai rata-rata, atau tidak melakukan apa-apa dan menyerahkan tugas yang ditulis ChatGPT untuk mendapatkan nilai tinggi
- Bisa saja dinilai bahwa jika tulisan Claude saat ini ditunjukkan kepada orang 10 tahun lalu, tidak akan ada banyak hal yang mereka keluhkan
- Tulisan LLM memang menunjukkan repetisi jika dibaca lama, tetapi cukup sesuai dengan standar tradisional tentang tulisan yang “layak”
- Kini nilai yang lebih penting bergeser ke ekspresi yang orisinal
- Meskipun tata bahasanya salah, jika berbeda maka ia punya nilai; meskipun kosakatanya terbatas, jika menghindari kata-kata LLM yang berulang, tulisan itu terasa lebih manusiawi
- Salah ketik tidak lagi sekadar cacat, tetapi bisa diterima sebagai jejak kemanusiaan yang membedakannya dari teks AI yang datar dan tergeneralisasi
Janji untuk menulis tanpa LLM
- Kontrak sosial berlaku ketika, sebagaimana pembaca meluangkan waktu untuk membaca, penulis juga meluangkan waktu untuk menulis
- Tulisan yang disusun sambil memutar film lama dan menghabiskan sebagian besar hari mengandung upaya yang sepadan dengan waktu yang diberikan pembacanya
- Menulis adalah aktivitas yang menyenangkan, dan sudah dilakukan sepanjang hidup, meskipun tingkat konsistensinya berbeda-beda
- Ke depan ada tekad untuk menjadikan menulis sebagai rutinitas yang lebih sehari-hari, dan hal itu dipandang bermakna serta layak dilakukan
1 komentar
Opini di Lobste.rs
Kalimat dalam RFD Oxide ini tampak seperti versi meme ai;dr yang kurang tajam dan kurang enak dikutip, tetapi jauh lebih eksplisit
“Saat tidak ada LLM, diasumsikan bahwa penulis telah mengerahkan upaya intelektual yang lebih besar daripada pembaca” pada akhirnya berarti “kalau kamu tidak mau bersusah payah menulisnya, aku juga tidak mau bersusah payah membacanya”
Saya tidak merasakan adanya keahlian dari penulis yang menyisipkan LLM ke dalam pekerjaan mereka
Semua aroma LLM ini terlihat seperti teriakan keras, “saya payah dan tidak berniat melakukan pekerjaan saya.” Mungkin untuk perangkat lunak orang bisa berargumen bahwa hasil berdispersi rendah yang konsisten, dapat diprediksi, dan membosankan itu bagus, tetapi untuk tulisan saya rasa umumnya justru sebaliknya
Justru saya merasa kita membutuhkan lebih banyak tulisan yang konsisten, dapat diprediksi, dan membosankan. Sebagian besar panduan menulis lebih mengutamakan gaya daripada kejelasan dan kebenaran. Saya tidak sedang membela tulisan AI, saya juga tidak memakai AI untuk menulis secara langsung dan tidak suka baunya, tetapi saya berharap lebih banyak penulis manusia punya keberanian untuk menjadi membosankan
Pull request juga sama. Dulu sebagian besar upaya dicurahkan untuk memikirkan masalah secara mendalam dan menulis kode
Review memang bisa menjadi banyak kerja, tetapi setidaknya ada keseimbangan, dan kalau pun tidak seimbang biasanya karena review sekaligus berperan sebagai onboarding atau pendidikan. Kalau Anda peduli pada kualitas proyek, sekarang persamaannya sudah berubah total. Orang-orang yang bahkan tidak punya ketertarikan pada proyek bisa membanjiri PR beberapa orde magnitudo lebih cepat daripada kecepatan orang bisa mereviewnya
Benar-benar menyebalkan. Review kode setidaknya masih punya keuntungan berupa sistem seperti
vouchuntuk menahan PR dari kontributor baru. Tetapi untuk hal seperti tulisan blog, saya terus dibuat curiga apakah penulisnya benar-benar orang yang paham dan peduli, atau saya hanya sedang menabrak tembok slop lagi. Untuk saat ini slop masih mudah dikenali, tetapi kemungkinan besar itu juga akan berubah saat para produsen menyuruh model untuk menghindari pola-pola yang khas. Satu-satunya slop yang saya sambut hanyalah LinkedIn yang dipenuhi komentar slopSebelumnya sudah berupa sampah pamer diri, sesudahnya tetap sampah pamer diri. Hanya saja sekarang ditambah gambar AI bergaya kartun
Pada dasarnya apa pun yang dibuat sebelum 2022 saya anggap jauh lebih tidak mencurigakan. Orang yang tahu juga memasukkan
before:2022saat mencari gambarKontrak sosial terpenting saat membaca tulisan blog adalah bahwa penulis akan terus memperbaiki kemampuan menulisnya melalui pengalaman itu
Penggunaan LLM juga merusak itu. Soal memakai LLM untuk menulis kode masih bisa diperdebatkan, tetapi memakai LLM khususnya untuk menulis blog itu benar-benar menjijikkan
Ini berhasil mengungkapkan dengan baik pikiran dan perasaan yang sudah lama saya pendam. Terutama soal menginginkan ketidaksempurnaan sentuhan manusia
Saya menginginkan itu dari orang lain, dan saya juga ingin kemanusiaan saya terlihat dalam karya saya. Ejaan saya sangat buruk sehingga teman dan rekan kerja sering mengejek saya karenanya, dan saya pernah serius memikirkan untuk sengaja membiarkan beberapa kesalahan saat menulis tulisan blog agar terlihat bahwa saya masih manusia. Tentu saja mungkin itu agak berlebihan
Saya sangat merasa terwakili oleh kalimat “saya menikmati menulis dan sudah melakukannya seumur hidup, dan sekarang saya mencoba melakukannya dengan lebih rutin. Rasanya bermakna dan layak dilakukan,” tetapi saya punya dua ketakutan
Pertama, ketika melihat seseorang kebetulan mulai ngeblog atau mulai menerbitkan lebih banyak sekitar 2024/2025, saya pada dasarnya akan menggolongkannya sebagai AI dan mengarsipkannya seperti itu. Blog saya sendiri juga akan terlihat seperti itu dari luar. Kedua, saya tidak suka bahwa tulisan saya membantu perusahaan AI membuat model yang lebih baik. Meski agak munafik, saya sendiri juga memakai AI setiap hari
Untuk masalah kedua, saya tidak benar-benar melihat cara untuk membunuh sekian banyak Goliath. Untuk masalah pertama, saya berharap akan ada semacam bukti kerja manusia yang membuktikan bahwa ada cukup perhatian manusia di balik konten tersebut. Saya sempat mempertimbangkan streaming lewat Twitch saat menulis, tetapi itu terlalu tidak realistis, dan rasanya memalukan untuk membuka proses menulis, termasuk ide-ide bodoh, kesadaran bahwa “yang saya tulis sekarang benar-benar salah,” serta pengungkapan ulang tanpa akhir demi menyesuaikan selera. Saya tidak terpikir cara pembuktian lain
Saat ini saya sedang menulis tulisan blog teknis yang cukup rumit, dan semua kalimat di badan teks saya tulis sendiri dengan tangan
Perlu beberapa kali percobaan untuk menangkap apa yang ingin saya katakan, tetapi sekarang strukturnya terasa sudah cukup bagus. Bagian di mana saya memakai Claude sebagai alat adalah mengubah penjelasan teks menjadi diagram Mermaid. Saya berterima kasih atas usaha yang masuk ke Mermaid, tetapi terutama jika keluar dari struktur standar seperti flowchart atau sequence diagram, sebagian sintaksnya terasa terlalu rumit. Saya bekerja di Oxide dan juga ikut memberi masukan sampai taraf tertentu pada RFD 576