Saya orang Kenya. Saya tidak menulis seperti ChatGPT. ChatGPT yang menulis seperti saya
(marcusolang.substack.com)- Gaya bahasa Inggris formal yang dibentuk oleh sistem pendidikan Kenya terus dianggap tampak seperti tulisan yang dihasilkan AI
- Pelatihan struktural dalam pengajaran menulis bahasa Inggris menekankan keseimbangan kalimat, alur logis, dan penggunaan kata penghubung, sehingga menghasilkan hasil yang mirip dengan tulisan AI
- Gaya ini merupakan warisan pendidikan bahasa Inggris gaya Inggris pada masa kolonial, dan dipertahankan sebagai simbol status sosial dan pendidikan
- Menyoroti masalah bias pada detektor AI dan model bahasa yang menilai tulisan penutur non-native sebagai sesuatu yang ‘tidak manusiawi’
- Menekankan bahwa yang tampak melalui tulisan bukanlah mesin, melainkan produk dari sejarah, pendidikan, dan identitas bahasa
Kesalahpahaman tentang tulisan AI dan manusia
- Berangkat dari pengalaman menerima umpan balik bahwa proposal penulis “terasa seperti ditulis oleh ChatGPT”
- Karena gayanya terstruktur dan logis, tulisan itu dinilai ‘kurang terasa manusiawi’
- Banyak penulis mengalami reaksi serupa, dan hal ini berkaitan dengan prasangka terhadap penulis non-native
- Penulis menjelaskan bahwa alasan gayanya mirip AI adalah karena AI mempelajari cara pendidikan mereka menulis
Pembentukan pendidikan bahasa Inggris ala Kenya
- Ujian menulis bahasa Inggris dalam KCPE (Kenya Certificate of Primary Education) menjadi inti pelatihan menulis
- Untuk mendapat nilai tinggi dari total 40 poin, siswa harus menguasai kosakata yang kaya dan struktur kalimat kompleks
- Aturan penulisan diringkas menjadi tiga hal
- Memulai dengan peribahasa atau kalimat kuat, menggunakan kosakata yang beragam, menjaga struktur yang sempurna
- Guru berperan sebagai ‘algoritme asli’ yang mengoreksi tata bahasa dan struktur dengan pena merah
- Pelatihan ini menekankan susunan kalimat yang logis dan seimbang, dan berlanjut hingga SMA dan universitas
Warisan kolonial dan hierarki bahasa
- Pendidikan bahasa Inggris di Kenya berakar pada sistem bahasa Kekaisaran Inggris
- Menekankan ketepatan tata bahasa dan formalitas berdasarkan ‘Queen’s English’
- Bahkan setelah kemerdekaan, bahasa ini tetap dipertahankan sebagai bahasa resmi dan simbol status sosial
- Kemampuan berbahasa Inggris yang rapi menjadi tolok ukur tingkat pendidikan dan kelas sosial
- Akibatnya, ragam formal dalam jumlah besar yang dipelajari AI pun memiliki bentuk yang mirip dengan hasil pendidikan bahasa Inggris ala Kenya
Bias dan keterbatasan detektor AI
- Detektor AI menilai berdasarkan ‘perplexity (tingkat ketertebakan)’ dan ‘burstiness (variasi panjang kalimat)’
- Struktur kalimat yang mudah diprediksi dan ritme yang konsisten dianggap tidak manusiawi
- Namun pendidikan ala Kenya justru menjadikan gaya yang dapat diprediksi dan seimbang sebagai ideal
- Hasil penelitian menunjukkan bahwa detektor seperti ini lebih mungkin salah mengklasifikasikan tulisan penutur non-native sebagai buatan AI
- Ini memperlihatkan bias teknis yang menyingkirkan keberagaman bahasa
Mendefinisikan ulang kemanusiaan dan bahasa
- Tulisan penulis Kenya adalah hasil pendidikan, sejarah, dan budaya, bukan mesin
- Mengkritik kenyataan bahwa standar ‘tulisan yang manusiawi’ dibatasi pada ekspresi yang informal dan bergaya Amerika
- Penulis di Nairobi, Lagos, Mumbai, dan kota lainnya juga berbagi tradisi menulis yang menghargai ketepatan dan logika
- Penilaian bahwa sesuatu “terlihat seperti AI” adalah pandangan yang gagal mengenali bentuk kemanusiaan yang lain
- Tulisan ditutup dengan penegasan bahwa inilah cara orang Kenya menulis, dan cara ini telah berlangsung sejak lama
2 komentar
Komentar Hacker News
Generasi kami belajar aturan tak tertulis dalam menulis yang diturunkan dari guru ke murid
Kalimat pertama harus selalu dimulai dengan peribahasa atau kalimat yang kuat, dan alih-alih kata biasa kami harus memakai ungkapan seperti ‘strode purposefully’
Namun saat belajar menulis di universitas, perlahan kami justru terdorong ke kalimat sederhana dan ungkapan pendek
Sekarang gaya Hemingway terasa ideal. Gaya ChatGPT yang berbunga-bunga justru melelahkan
Saya mengakui kemampuan penulisnya, tetapi saya lebih suka tulisan yang sederhana dan jelas
Obsesi menulis kalimat pendek telah merusak prosa bahasa Inggris
Bagi kebanyakan orang, kesederhanaan memang membantu, tetapi kecenderungan menganggap kalimat panjang, titik koma, atau kosakata bernuansa sebagai ‘tulisan buruk’ adalah masalah
Sikap seperti ini menghambat perkembangan pembaca maupun penulis
Meski begitu, ungkapan seperti ‘proceeded to’ tetap sampah. Memaksa murid memakai kata-kata yang terdengar ‘pintar’ adalah cara pendidikan yang paling buruk
Istri saya seorang penulis, dan katanya kata ‘strode’ muncul sangat sering dalam fanfic atau novel roman. Menulis seolah setiap orang selalu ‘melangkah mantap’ saat berjalan adalah ciri amatir yang umum
Ada sinyal kelas sosial yang tersembunyi dalam gaya menulis
Seperti yang dikatakan artikel itu, bahasa Inggris yang kami pelajari adalah ‘Queen’s English’ dari era imperialisme, bahasa kekuasaan
Mempelajari keindahan bentuk tulisan bukan sekadar untuk lulus ujian, tetapi tindakan untuk membuktikan bahwa seseorang adalah ‘orang beradab’
Tren menulis mirip dengan siklus mode sosial. Saat gaya mewah menjadi populer di kalangan umum, kelas atas justru membedakan diri dengan gaya sederhana
Gaya hemat ala Hemingway seperti ‘jeans robek seharga 1000 dolar’, tindakan sengaja tampak sederhana yang hanya bisa dilakukan orang yang punya kelonggaran
Saya pernah bekerja di salah satu perusahaan Big Three, dan gaya ChatGPT persis sama dengan gaya laporan evaluasi diri yang diajarkan di perusahaan
Kunci promosi bukan prestasi, melainkan seberapa baik membungkusnya menjadi ‘cerita’
Apakah kamu orang Amerika? Bahkan di dunia berbahasa Inggris, perbedaan budaya Inggris dan Amerika cukup besar
Orang Amerika cenderung kurang pretensius dan lebih langsung, sedangkan bahasa Inggris Britania masih cenderung mewah dan ornamental
Dalam pengamatan saya, kosakata orang Inggris makin berkurang dari generasi ke generasi
Ada dua tujuan dalam menulis
(1) Tulisan untuk menyampaikan ide — makin sederhana makin baik. Seperti esai Paul Graham, informasinya masuk ke kepala tanpa gesekan
(2) Tulisan untuk ekspresi diri — gaya yang mewah dan artistik lebih cocok
Seperti kata David Foster Wallace, yang pertama adalah tulisan yang berkomunikasi seperti percakapan, sedangkan yang kedua adalah tulisan seperti buku harian yang berteriak, “Inilah aku!”
Menarik bahwa sebagian besar data pelatihan LLM dikurasi di Kenya
Kalau datanya dibuat di Jepang, mungkin ChatGPT akan memakai akhiran gaya Jepang seperti “Don’t you agree?”
Artikel terkait
Pengaruh penulis buku pelajaran asal India, Malkiat Singh, cukup besar
Bukunya dipakai sebagai materi standar di Kenya, dan murid-muridnya kemudian menjadi kurator data LLM, sehingga gaya itu pada akhirnya meresap ke AI di seluruh dunia
Wiki Malkiat Singh
(Singkatnya) tampaknya memang tidak terhindarkan
Sepertinya 樣 sedang menyiapkan meme “ChatGPT (Japan)” XD
Tetapi pelabelan data terpisah dari data pelatihan untuk generasi teks pada LLM. Banyak orang salah paham soal ini
Saya membaca panduan gaya City News Bureau Chicago tahun 1897, dan ada banyak aturan menarik
Misalnya jangan mencampuradukkan ‘night’ dan ‘evening’, dan jangan memakai ‘very’ secara tidak perlu
Aturan-aturan kecil seperti ini menunjukkan kepekaan bahasa pada masa itu
Di mata saya, gaya tulisan ini sama sekali tidak terlihat seperti ChatGPT
Banyak orang menganggap penggunaan em-dash (—) sebagai jejak AI, tetapi itu sinyal yang lemah
Justru ChatGPT menghasilkan nada yang berlebihan dan ‘kemegahan kosong’
Jika paragraf-paragrafnya dibandingkan langsung, versi AI memang lebih mewah, tetapi terasa kurang tulus
Tulisan ini punya daya serap. Kebanyakan output GPT membuat fokus buyar begitu lewat satu paragraf
Setelah membacanya, rasanya tidak ada informasi yang tersisa
Perbedaan antara LLM dan manusia adalah kemampuan untuk tidak mengatakan apa-apa dengan banyak kata
Jika kamu memberi GPT kalimat yang sudah matang lalu memintanya ‘memperbaiki’, tentu hasilnya akan menjadi lebih bertele-tele
Teks asli punya hiasan struktural tetapi maknanya tetap hidup. Tulisan AI berkepadatan informasi rendah dan membosankan
Memburu em-dash secara membabi buta adalah perilaku orang yang tidak paham tata bahasa
Seniman dan YouTuber juga mengalami masalah yang sama
Fenomena disalahpahami karena terlihat seperti AI semakin meningkat
Sepertinya ada juga pengisi suara yang kehilangan pekerjaan karena suara mereka dianggap mirip suara AI
Saya juga mengunggah video Factorio, dan beberapa penonton berkomentar, “suara AI-nya mengganggu”
Padahal saya sendiri yang berbicara, dan wajah saya bahkan muncul di akhir video
Suara AI tidak punya emosi dan pelafalannya canggung, jadi biasanya langsung ketahuan
Belakangan ini banyak video tutorial ‘kosong isi’ yang hanya membacakan skrip buatan AI apa adanya
Karena itu sekarang saya hanya menonton video dari kreator yang saya percaya
Tautan video saya
Jika wajah orang sungguhan dipakai tanpa izin dalam generasi gambar AI, Pierce Brosnan mungkin orang pertama yang pantas mendapat kompensasi
Di tim kami juga ada rekan kerja yang berbicara seperti ChatGPT
Di WhatsApp dan Zoom, cara bicaranya terlalu mekanis, jadi saya bertanya ke Meta AI dan jawabannya, “ini terlihat seperti tulisan AI”
Tetapi dia bilang sebenarnya tidak memakai AI, dan sekarang saya pikir itu mungkin saja benar
Tetapi menyerahkan deteksi AI kepada AI itu tidak masuk akal. Itu seperti bertanya kepada dirinya sendiri
Saya juga pernah mengalami perasaan “ChatGPT menulis seperti saya”
Saya sering memakai daftar dan format, dan saya suka tulisan yang ramah untuk disleksia
Bahkan saat melihat catatan yang saya tulis pada 2019, sudah ada nuansa seperti ChatGPT
Saya juga sengaja memasukkan salah eja atau mencampur gaya yang tidak baku
Terus terang, kalau tulisanmu tidak bisa dibedakan dari output default ChatGPT, itu tulisan yang buruk
Meski sebenarnya tidak memakai AI, gaya seperti itu tetap perlu diperbaiki
Dalam pendidikan, nilai baik seharusnya hanya diberikan kepada orang yang bisa menulis lebih baik daripada AI
Agak lucu menyalahkan rekan kerja karena “berusaha terdengar pintar seperti ChatGPT”
Perdebatan soal em-dash ini menarik
Dulu saya hanya melihatnya saat Word mengubahnya otomatis, dan belum pernah memasukkannya sendiri
Baru kali ini saya tahu bahwa di Windows harus menekan Alt+0151
Jadi bagi saya em-dash masih simbol yang asing
Sekarang saya jadi paham bahwa orang menulis di lingkungan yang berbeda-beda
Sebenarnya di HN sudah ada orang-orang yang gemar memakai em-dash sejak sebelum ChatGPT
Peringkat pengguna em-dash di HN
Saya menyalakan Typo mode di emacs agar en/em dash dan smart quotes dipakai otomatis
Saya pernah menganalisis dataset HN, dan bahkan setelah AI menyebar, penggunaan em-dash tidak meningkat
Namun struktur kalimat bertanda kurung yang berlebihan memang ciri AI atau tulisan yang belum matang
Di Notes macOS,
--pernah otomatis diubah menjadi—, sehingga perintah terminal saya gagalSaya kagum dengan kemampuan bahasa Inggris OP
Kebanyakan nonpenutur asli belajar bahasa Inggris sastra di sekolah, jadi gaya formal terasa akrab
Saya juga mendapat pendidikan seperti itu di Prancis, tetapi setelah bekerja di industri TI saya beralih ke bahasa Inggris Amerika yang lugas
Tulisan ini bukan buatan ChatGPT. Tidak ada hiasan yang tidak perlu, dan kepadatan informasinya tinggi
Tulisan AI biasanya membuat saya melewatkan lebih dari setengah isinya, tetapi tulisan ini adalah jenis tulisan yang membuat saya tak ingin melewatkan satu kata pun
Ini semacam kutukan bagi orang yang menulis dengan baik
Karena ChatGPT dirancang meniru ‘tulisan yang baik’, orang yang menulis bagus justru lebih mudah disalahpahami sebagai AI
Saya bahkan pernah melihat tulisan dengan banyak kesalahan tata bahasa tetap diserang karena terdengar seperti ChatGPT
Ada informasi publik bahwa ChatGPT dilatih dengan bahasa Inggris bisnis Afrika
Artikel terkait
Jika definisi ‘menulis dengan baik’ adalah gaya yang panjang lebar, aman, dan menghindari kritik, maka itu memang benar
Faktanya, LLM tidak menulis lebih baik daripada manusia
Tata bahasa dasar seperti ‘a/an’ pun masih sering salah, dan masih memakai ungkapan eliptik seperti ‘because traffic’
Melihat hal-hal seperti ini, kemampuan manusia untuk menyesuaikan makna dengan teliti masih tetap unggul
Tulisan OP tidak punya nuansa artifisial khas LLM
Penggunaan em-dash juga alami, dan emosi pribadi terasa di dalamnya
Saya benci gaya ChatGPT
Rasanya melelahkan seperti copy pemasaran, dan yang tersisa hanya kemewahan yang kosong
Tulisan seperti ini membuat pembaca lelah dan kemampuan penyampaian informasinya juga menurun
Mengejutkan bahwa gaya seperti ini diajarkan di Kenya
Kalimat “Saya tidak menulis seperti ChatGPT, ChatGPT yang menulis seperti saya” itu berkesan
Pada akhirnya kita tampaknya akan makin ditakdirkan berbicara dan menulis seperti ChatGPT
Anak-anak menyerahkan PR kepada AI, orang dewasa menyerahkan CV dan konseling kepada AI, dan bahkan dalam percakapan kita akan mulai memakai nada seperti “itu benar, mari saya rangkum alasannya dalam tiga poin”
(emoji centang) Tambahkan lebih banyak emoji — manusia menyukai emoji
(emoji X merah) Hindari kata-kata negatif seperti “bullshit”
(emoji jempol) Kita akan segera melampaui pembelajaran dari umpan balik manusia (senyum)
Tulisan yang menarik.