Utang kognitif yang menumpuk saat menulis esai dengan asisten AI

(arxiv.org)

1 poin oleh GN⁺ 2025-06-17 | 1 komentar | Bagikan ke WhatsApp

Makalah prapublikasi yang mengukur biaya kognitif penggunaan LLM dalam pendidikan penulisan esai, dengan eksperimen untuk melihat apakah alat AI yang banyak dipakai dalam belajar dan bekerja dapat melemahkan kemampuan belajar
Peserta dibagi ke dalam kelompok LLM, Search Engine, dan Brain-only, lalu menulis esai sebanyak 3 kali; pada sesi ke-4, sebagian dari kelompok LLM menulis tanpa alat, sementara sebagian dari kelompok Brain-only menggunakan LLM
Pada sesi 1–3 ada 54 orang yang berpartisipasi, dan pada sesi ke-4 18 orang di antaranya ikut serta; studi ini menggabungkan EEG, analisis NLP, wawancara per sesi, serta penilaian oleh guru manusia dan AI judge yang dibuat terpisah
Semakin besar dukungan eksternal, semakin rendah konektivitas otak; kelompok Brain-only menunjukkan jaringan terkuat, kelompok Search Engine berada di tingkat menengah, sementara dukungan LLM menunjukkan keterhubungan keseluruhan yang paling lemah
Selama 4 sesi dalam 4 bulan, kelompok LLM menunjukkan kinerja yang lebih rendah dibanding kelompok Brain-only pada level neural, bahasa, dan penilaian; rasa kepemilikan serta kemampuan mengutip segera setelah menulis juga lebih rendah

Biaya kognitif LLM yang diukur dalam penulisan esai

Berfokus pada pemeriksaan biaya yang ditinggalkan penggunaan LLM pada proses kognitif saat menulis esai di lingkungan pendidikan
LLM memungkinkan pengalaman belajar yang dipersonalisasi, umpan balik instan, dan perluasan akses ke sumber daya pendidikan, tetapi semakin luas penggunaannya, keterlibatan dalam berpikir kritis dan proses analisis mendalam dapat berkurang
Penulisan esai dipilih karena merupakan tugas umum untuk menilai kemampuan siswa di sekolah dan ujian terstandar, sekaligus pekerjaan kompleks yang menuntut berbagai proses kognitif secara bersamaan
Makalah ini berstatus preprint, under review

Peserta dan desain sesi

Peserta dibagi menjadi tiga kelompok
- Kelompok LLM: menulis esai dengan alat LLM yang ditentukan
- Kelompok Search Engine: menulis esai menggunakan mesin pencari
- Kelompok Brain-only: menulis esai tanpa alat eksternal
Pada sesi 1–3, setiap peserta tetap berada pada kondisi kelompok yang sama
Pada sesi ke-4, kondisi sebagian peserta diubah
- LLM-to-Brain: peserta yang sebelumnya menggunakan LLM menulis tanpa alat
- Brain-to-LLM: peserta yang sebelumnya menulis tanpa alat menggunakan LLM
Pada sesi 1–3, total 54 orang berpartisipasi, dan sesi ke-4 diselesaikan oleh 18 orang di antaranya
Di setiap sesi, peserta memilih salah satu topik SAT untuk menulis esai; pada sesi 1–3, disediakan 3 topik per sesi, dengan total 9 pilihan topik

Metode pengukuran

EEG digunakan untuk mengukur aktivitas otak
- Aktivitas otak peserta direkam untuk mengevaluasi keterlibatan kognitif dan beban kognitif
- Tujuannya juga mencakup pemahaman yang lebih mendalam tentang aktivasi neural selama penulisan esai
Analisis NLP diterapkan pada teks esai
- Named Entities Recognition(NER)
- n-gram
- ontologi topik
- kemiripan dan jarak berbasis embedding
Setelah setiap sesi, peserta diwawancarai
- kepatuhan pada struktur esai
- kemampuan mengutip dari esai
- akurasi kutipan
- rasa kepemilikan terhadap esai
- kepuasan, dan lain-lain
Untuk penilaian, digunakan guru manusia bersama AI judge yang dibuat secara terpisah

Hasil EEG: semakin banyak dukungan eksternal, semakin rendah konektivitas otak

Ketiga kelompok menunjukkan pola koneksi neural yang berbeda, yang mencerminkan strategi kognitif yang berbeda
Konektivitas otak menurun secara sistematis sesuai jumlah dukungan eksternal
- Kelompok Brain-only: menunjukkan jaringan yang paling kuat dan luas
- Kelompok Search Engine: menunjukkan keterlibatan tingkat menengah
- Dukungan LLM: keterhubungan keseluruhan paling lemah
Pada sesi ke-4, peserta LLM-to-Brain menunjukkan konektivitas neural yang lebih lemah serta keterlibatan jaringan alpha dan beta yang lebih rendah
Sebaliknya, peserta Brain-to-LLM menunjukkan recall memori yang lebih tinggi serta keterlibatan kembali node occipito-parietal dan prefrontal secara luas
- Pola ini kemungkinan berkaitan dengan pemrosesan visual, dan mirip dengan pola yang sering diamati pada kelompok Search Engine

Karakteristik esai yang terlihat dari analisis bahasa

Di dalam masing-masing kelompok, ditemukan homogenitas yang konsisten pada NER, n-gram, dan ontologi topik
Esai kelompok LLM menunjukkan ciri linguistik yang lebih seragam di dalam kelompok yang sama
Kelompok Search Engine menunjukkan penggunaan n-gram yang tampak dipengaruhi optimasi pencarian pada beberapa topik
- Contoh: pada topik PHILANTHROPY, terlihat fokus pada n-gram homeless
Jarak antar-esai dalam kelompok Brain-only selalu tampak signifikan dan lebih besar dibanding kelompok LLM atau Search Engine
Pada beberapa topik, perbedaan antara kelompok LLM dan Brain-only muncul hampir pada tingkat ortogonal
- Contoh: topik HAPPINESS, PHILANTHROPY

Rasa kepemilikan, memori, dan kemampuan mengutip

Dalam wawancara, kelompok LLM memiliki rasa kepemilikan yang rendah terhadap esai mereka sendiri
Kelompok Search Engine juga menunjukkan rasa kepemilikan yang tinggi, tetapi lebih rendah dibanding kelompok Brain-only
Kemampuan mengutip isi dari esai sendiri yang baru ditulis beberapa menit sebelumnya juga tampak rendah pada kelompok LLM
Kelompok Brain-only menunjukkan rasa kepemilikan dan kemampuan mengutip yang tinggi
Peserta Brain-to-LLM pada sesi ke-4 menggunakan LLM, tetapi menunjukkan integrasi konten yang lebih baik dalam bentuk yang berpadu dengan pengaruh sesi Brain-only sebelumnya, sementara rasa kepemilikannya terbagi

Perbedaan dalam eksperimen peralihan sesi ke-4

Peserta Brain-to-LLM menunjukkan konektivitas neural yang lebih tinggi dalam kondisi menulis ulang dengan alat AI setelah sebelumnya menulis tanpa AI
- Directed connectivity pada pita alpha, beta, theta, dan delta meningkat di seluruh jaringan
- Interaksi jaringan otak yang lebih luas muncul dibanding sesi LLM-only 1–3 sebelumnya
Peserta LLM-to-Brain menunjukkan upaya neural yang kurang terkoordinasi di sebagian besar pita ketika menulis tanpa alat setelah pengalaman menggunakan LLM sebelumnya
- Bias kosakata khas LLM juga muncul
- Baik AI judge maupun guru manusia memberi skor tinggi, tetapi jarak penggunaan NER dan n-gram kurang menonjol dibanding kelompok dan sesi lain
Ketika kelompok Brain-only menggunakan LLM pada sesi ke-4, konektivitas otak sesi ke-4 tidak kembali ke pola sesi pertama Brain-only tingkat pemula dan juga tidak mencapai tingkat sesi ke-3 Brain-only
- Menunjukkan kondisi menengah dalam keterlibatan jaringan

Kesimpulan dan keterbatasan

Penggunaan LLM memberi dampak yang dapat diukur pada peserta, dan manfaat awalnya tampak jelas, tetapi dalam sesi selama 4 bulan, kelompok LLM menunjukkan kinerja lebih rendah dibanding kelompok Brain-only pada berbagai level
Kinerja yang lebih rendah diamati bersamaan pada konektivitas neural, ciri linguistik, dan hasil penilaian
Pada saat dampak LLM terhadap pendidikan bagi masyarakat umum baru mulai terbentuk, kemungkinan penurunan kemampuan belajar tetap menjadi isu penting
Makalah ini bertujuan berperan sebagai panduan awal untuk memahami dampak kognitif dan praktis AI terhadap lingkungan belajar

1 komentar

GN⁺ 2025-06-17

Komentar Hacker News

Alih-alih menyebutnya “akumulasi utang kognitif”, saya akan menyebutnya sekadar penurunan kognitif atau hilangnya kemampuan kognitif
Wajar saja kalau bahasa yang tidak dipakai akan terlupakan, dan otak tidak mempertahankan informasi yang tidak dibutuhkan. Dalam studi tentang penggunaan navigasi Google Maps juga ada temuan bahwa “penggunaan GPS secara kebiasaan berdampak negatif pada memori spasial saat navigasi mandiri”, atau bahwa penurunan materi abu-abu diamati pada pengguna peta
Siapa pun yang pernah membangun keahlian di bidang sains tahu bahwa untuk memahami sesuatu, kita perlu merenungkannya dan menelusuri bagaimana tiap ide terhubung dengan hal lain. Kita tidak bisa memahami matematika hanya dengan menyapu baca buku teks matematika; kita harus berhenti dan berpikir. Menurut saya, objek mental yang nantinya dapat dipakai untuk berpikir justru diciptakan oleh tindakan berpikir itu sendiri
- Bagian terpenting dari “Kita tidak bisa memahami matematika hanya dengan menyapu baca buku teks matematika; kita harus berhenti dan berpikir” adalah menulis
  Kita harus banyak menulis. Menulis membuat otak menyusun pikiran, memungkinkan dialog yang terstruktur dengan diri sendiri, dan membuat kita menjelajahi banyak jalur. Dengan berpikir dan merenung saja, kita segera mencapai batas, tetapi menulis memungkinkan eksplorasi pikiran hampir tanpa akhir
  Jika pikiran begitu erat terkait dengan menulis, dan menulis bisa berupa prosa, gambar, persamaan, grafik, bagan, atau apa pun, menarik untuk melihat bagaimana situasi ketika LLM mengambil alih semakin banyak kegiatan menulis akan memengaruhi kemampuan kognitif
- Saya akan menyebut ini utang kognitif. Pernahkah Anda menulis laporan besar dengan LLM?
  Sangat menggoda untuk menyuruh LLM menulis banyak teks, menyusun struktur, serta membuat argumen dan materi visual. Ketika sedikit demi sedikit kita menyerahkan lebih banyak, pada akhirnya hasilnya sama sekali bukan milik kita
  Namun nama saya tercantum di laporan itu, dan saya diminta menjelaskan serta memahaminya. Seharusnya laporan adalah “proyeksi dua dimensi” dari “realitas berdimensi tinggi” yang ada di dalam kepala, tetapi laporan yang dimuntahkan dalam sepersepuluh waktu tidak seperti itu. Di atas kertas tampak meyakinkan, tetapi ketika harus menjelaskan konsepnya, kita akan tersendat
  Pada akhirnya kita menyadari bahwa kita harus mengerjakannya sendiri, membangun model mental, mengekspresikannya, mengekspresikannya ulang, lalu mengekspresikannya ulang lagi. Caranya harus berbeda tergantung target pembaca
  Menurut saya, utang kognitif adalah istilah yang tepat untuk menjelaskan kesenjangan antara model mental yang seharusnya dibangun demi menulis laporan sebelum era LLM, dan model mental yang nyaris tidak perlu dibangun ketika menggunakan LLM
  Pada akhirnya, nama saya akan tercantum di laporan atau makalah. Apa yang bisa diharapkan dari saya sebagai penulis? Seiring waktu, ekspektasi itu mungkin menurun. Jika muncul pertanyaan mendalam, orang mungkin akan melewati penulis dan mengandalkan model “mental” LLM. Namun model lain seperti LLM pada dasarnya bisa memiliki “model”, yaitu algoritma prediksi, yang berbeda tentang kebenaran fundamental dan realitas. Mana yang memungkinkan prediksi paling akurat? Untuk itu dibutuhkan kedalaman pemahaman tertentu, dan jika terlalu bergantung pada LLM untuk menulis, kedalaman itu tidak akan terbentuk
  Dalam jangka panjang, ini memang bisa mengarah pada “penurunan kognitif, atau hilangnya kemampuan kognitif” pada tingkat populasi, tetapi saya berhati-hati untuk menyimpulkannya demikian. Mesin cetak tidak menghasilkan hal seperti itu, meskipun elite agama saat itu khawatir orang awam tidak akan mampu menafsirkan teks dengan benar
  Seperti yang juga muncul di thread ini, menurut saya “menulis adalah berpikir”. Namun mungkin saja ada sesuatu yang lebih baik daripada menulis yang belum kita temukan. Berpikir adalah mengembangkan model mental yang rinci, yang memungkinkan kita memprediksi masa depan dengan probabilitas lebih tinggi daripada kebetulan. Kelangsungan hidup kita bergantung padanya, dan dari sudut pandang teori informasi, evolusi pun memang demikian [0]. “Tidak ada apa pun dalam biologi yang masuk akal tanpa cahaya informasi”
  [0] https://www.youtube.com/watch?v=4PCHelnFKGc
- Kalau “otak tidak mempertahankan informasi yang tidak dibutuhkan”, mengapa saya masih tahu cara mengatur config.sys dan autoexec.bat untuk mengoptimalkan memori dasar DOS?
  Saya tidak pernah melakukannya selama 20 tahun, dan cukup yakin tidak akan pernah melakukannya lagi
- Ungkapan seperti “penurunan kognitif” atau “brain rot” mungkin terdengar terlalu sensasional, dan agar adil, para penulis juga mencantumkan keterbatasan berupa ukuran sampel yang kecil
  Fakta bahwa makalah itu tidak memberikan referensi atau sitasi untuk istilah “utang kognitif” juga membuat judulnya terasa agak janggal. Bisa saja itu diubah pada menit-menit terakhir
  Ini studi menarik dari MIT. Seperti semua studi psikologi, perlu skeptisisme yang sehat dan verifikasi independen. Memang terasa seperti campuran berbagai hal, lengkap dengan pencitraan dan evaluasi psikometrik, tetapi siapa yang tidak suka gambar semacam “Beginilah otak Anda saat memakai LLM”
- Pernyataan “otak tidak mempertahankan informasi yang tidak dibutuhkan” terdengar masuk akal, tetapi bagaimana menjelaskan keterampilan seperti mengendarai sepeda, yang sering dikatakan tidak akan hilang begitu dipelajari?
LLM makin terasa seperti satu lagi teknologi yang pada akhirnya akan membuat masyarakat membangun kekebalan sendiri
Di dunia pendidikan, ini sudah mulai terlihat lewat guru yang berbicara dengan siswa, mengamati bagaimana mereka belajar, dan memeriksa proses saat mereka memperlihatkan keterampilan. Di bisnis pun, orang akan segera menyadari bahwa sebagian besar komunikasi yang bernilai harus dibuat langsung oleh manusia sebagai penulis dari apa yang ingin mereka sampaikan. Tindakan menulis kira-kira mencakup dua pertiga inti dari kebanyakan komunikasi
Tentu saja, sebelum itu kita mungkin harus mengalami guncangan pendangkalan cara berpikir yang dramatis agar benar-benar kebal terhadap efek sampingnya. Penolakan para ahli terhadap LLM, berhadapan dengan para penggemar naif yang memuja “kebiasaan rata-rata”, tampak seperti pengalaman kekebalan awal: https://fly.io/blog/youre-all-nuts/
Setiap kali saya memakai LLM secara “makro” dalam proyek saya, cara berpikir saya selalu rusak parah, keputusan saya diambil alih, dan kesiapan saya untuk beradaptasi setelahnya menjadi lebih buruk. Untuk pekerjaan penting, LLM secara ketat hanyalah alat pengisi celah mikro
Ini berbeda dari kalkulator. Ini bukan soal kehilangan algoritma yang dulu saya sukai untuk menghitung manual. Ini adalah sistem yang mengganti kegiatan berpikir itu sendiri dengan non-berpikir, dan di setiap bidang penggunaannya ia merusak kesiapan, kedalaman, kemampuan beradaptasi, dan rasa kepemilikan secara serius
- Saya percaya salah satu kemampuan yang paling diremehkan dalam bisnis adalah kemampuan merangkai narasi yang koheren
  Saya sering ikut rapat dengan insinyur-insinyur yang sangat hebat, tetapi mereka sering tidak mampu menyampaikan argumen mereka dengan cara yang bisa diikuti baik oleh orang teknis maupun nonteknis. Ada unsur seni dalam menulis dan berbicara, dan baru sekarang, di usia akhir 40-an, saya benar-benar mulai menyadari nilainya. Bahasa adalah alat yang kuat, dan pilihan satu kata kadang bisa menyelamatkan atau menghancurkan sebuah argumen
  Saya tidak tahu apa yang bisa dilakukan LLM terhadap situasi ini selain membuatnya jauh lebih buruk secara umum
- Ini sudah terjadi. Saat berbicara dengan engineer junior di platform chat tentang ide terbaru, jawaban real-time mulai muncul sepanjang satu halaman dan terstruktur dengan bullet point
  Yang menakutkan bukan hanya bahwa mereka memakai ChatGPT untuk menghindari berpikir, tetapi juga bahwa mereka mengira tak seorang pun akan menyadarinya, atau percaya bahwa memang begitulah cara orang dewasa berbicara
- Saya suka optimisme tentang “satu lagi teknologi yang pada akhirnya akan membuat masyarakat membangun kekebalan”. Kita bahkan belum punya kekebalan kelompok terhadap teknologi media sosial era 2010-an, tetapi saya terima optimisme itu
- Jika sebagian besar komunikasi yang bernilai harus berasal dari manusia, kita juga bisa bertanya: seberapa besar sebenarnya bagian komunikasi yang bernilai?
  Menurut saya, pada kenyataannya banyak juga komunikasi yang tidak terlalu bernilai. Namun tetap saja dibuat; kalau tidak ada yang membacanya, bukankah pembuatannya boleh saja diotomatisasi?
  Tentu saja ada cukup banyak hal penting yang memang harus tepat
- Intinya adalah seberapa banyak komunikasi yang “bernilai” itu
  Saya berada di dunia akademik, yang secara teori seharusnya menjadi salah satu profesi yang paling menuntut pemikiran. Namun lebih dari separuh tulisan yang saya buat adalah berbagai laporan, proposal hibah riset, pengajuan etik dan manajemen data, surat rekomendasi, serta formulir administrasi. Semua itu sulit disebut “bernilai” dalam arti tidak menuntut pemikiran yang berguna; selama persyaratan bodohnya terpenuhi, tidak ada yang peduli apakah teksnya terdengar seperti saya atau tidak
  Untuk penggunaan seperti ini, LLM adalah berkah, dan karena memungkinkan saya menghabiskan lebih banyak waktu untuk riset nyata dan pengajaran tatap muka, justru kemungkinan besar membantu saya berpikir
Saya rasa pembahasan tentang utang kognitif di sini akurat, tetapi malah mungkin terlalu konservatif
Ini bukan sekadar kehilangan keterampilan seperti lupa teknologi semacam bahasa, atau kehilangan memori spasial karena memakai GPS. Bisa jadi ini masalah jalur saraf yang bertanggung jawab atas penalaran terpadu menyusut secara sistematis dan tidak dapat dipulihkan
Risiko utamanya bukan “utang” itu sendiri, yang bernuansa dapat dibayar kembali lewat latihan, melainkan melewati titik kritis kognitif. Sebuah ambang saat fungsi eksekutif, sintesis, dan argumentasi terlalu banyak dipindahkan ke sistem eksternal seperti LLM, sehingga otak biologis bukan hanya memangkas koneksi yang tidak dipakai berdasarkan efisiensi tanpa ampun, tetapi juga kehilangan kemampuan meta untuk membangunnya kembali
Perangkat keras basah biologis kita adalah sistem “pakai atau hilang” tanpa version control. Jika fungsi kognitif kompleks menyusut, “source code”-nya rusak. Tidak ada git revert untuk jaringan saraf yang runtuh yang dulu menopang pemikiran mendalam dan terstruktur
Thread HN ini berfokus pada penulisan esai, tetapi jika skalanya diperbesar, kita sedang menjalankan eksperimen besar yang tak terkendali untuk mengalihdayakan kognisi kolektif. Hasil jangka panjangnya mungkin bukan masyarakat yang kurang terampil, melainkan masyarakat yang secara struktural tidak mampu melakukan jenis pemikiran yang membangun dunia kita
Jadi pertanyaannya bukan “bagaimana menghindari utang kognitif?” Pertanyaan yang benar-benar menakutkan adalah: “Jika wadah pikiran biologis dioptimalkan untuk kemalasan dengan begitu kejam, dan mungkin tak dapat dipulihkan, wadah seperti apa yang dibutuhkan oleh jiwa kita?”
https://github.com/dmf-archive/dmf-archive.github.io
- Untuk apa LLM digunakan adalah keputusan masing-masing orang. Untuk pekerjaan dengan friksi besar dan throughput rendah, misalnya riset online dengan alat pencarian yang buruk, saya merasa model teks sangat bagus
  Ia berguna untuk menanyakan hal yang tidak diketahui atau melewati “bagian membosankan”. Khususnya, saya sama sekali tidak merasa bahwa proses mencari solusi masalah teknis yang rumit di beberapa halaman forum atau media sosial membuat saya lebih pintar. Bagaimanapun, informasinya tetap harus diverifikasi dan diterima dengan hati-hati
  StackExchange sebagaimana niat awalnya dulu akan jauh lebih bernilai daripada model teks. Namun manusia di dunia nyata tidak sempurna dan membawa berbagai bias kognitif serta beban, sementara LLM tidak akan menutup pertanyaan sebagai “terlalu luas” tepat setelah pertanyaan itu mendapat rekomendasi dan interaksi
  Sebaliknya, saya masih menganggap tulisan LLM tentang topik yang saya kuasai sangat inferior. Misalnya saat mencoba menulis email, saya akhirnya menghabiskan waktu yang hampir sama untuk memperbaiki prompt agar arahnya tetap sesuai, atau menulis ulang besar-besaran hasilnya. Lebih baik saya menulis langsung mengikuti alur saya sendiri daripada mengoreksi dan melakukan peer review terhadap model teks
AI adalah kebalikan dari Zettelkasten
Alih-alih bekerja secara aktif pada suatu topik dan perlahan memperoleh wawasan yang makin dalam, kita berulang secara cepat tetapi dangkal di atas korpus konten yang dihasilkan AI
Misalnya, karena ingin lebih memahami situasi Timur Tengah, saya menjadikan OpenAI sebagai rekan penulis dan menulis esai 10 halaman tentang asal-usul Hamas dan Hizbullah
Namun saya tidak ingat apa pun, dan lebih buruk lagi, saya tidak tahu apakah hal-hal yang saya ingat itu halusinasi yang saya koreksi atau fakta sungguhan
- Orang-orang cerdas umumnya tahu bahwa menulis sama-sama merupakan aktivitas berpikir seperti halnya mendapatkan hasil tulisan
  LLM bisa menjadi partner sparring yang sangat baik jika digunakan bukan sebagai alat yang menuliskan untuk kita, melainkan sebagai alat untuk membantu menemukan kesalahan, menunjukkan celah dan kekeliruan, serta meneliti pertanyaan umum tentang dunia. Tentu saja, harus selalu berhati-hati dan memeriksa sumbernya
- Saya cenderung optimistis soal kegunaan LLM, tetapi saya setuju dengan poin ini
  Kita memang mengembangkan intuisi tentang cara mengendalikan model dan mengurangi halusinasi, tetapi itu bukan berarti membangun pengetahuan yang bisa dijelaskan dengan jelas atau melakukan pemikiran yang menantang. Ini lebih dekat ke mempelajari respons berbasis memori otot: melihat bentuk tertentu dari keluaran LLM lalu memutuskan apakah akan lebih memercayainya, mencoba strategi prompt lain, atau menghapus konteks atau tidak
  Kalaupun ini bisa disebut keterampilan, kemungkinan besar akan menjadi tidak berguna dalam beberapa tahun jika model membaik. Ada rasa tidak berdaya seperti yang mungkin dirasakan pekerja lini perakitan
- Karena kita cenderung lebih mengingat bagian yang bermasalah daripada bagian yang berjalan lancar, saya menganggap yang diingat adalah bagian yang harus diperbaiki sendiri
- Menarik melihat sudut pandang yang menganggap AI sebagai kebalikan dari mengakses pengetahuan yang saling terhubung, yaitu Zettelkasten
Secara pribadi, hasilnya tidak mengejutkan. Saat saya menggunakan AI untuk pekerjaan menulis atau menerjemahkan, saya tidak merasa terlibat secara mental dalam proses menulis atau menerjemahkan seperti ketika mengerjakannya sepenuhnya sendiri
Namun saya juga menyadari bahwa menggunakan AI dengan cara lain bisa sangat melibatkan secara mental dengan sendirinya. Selama 2 minggu terakhir, saya bereksperimen dengan Claude Code untuk melihat sejauh mana brainstorming, riset, dan penulisan esai serta makalah penelitian bisa sepenuhnya diotomatisasi. Saya terlibat sedalam ketika menulis atau menerjemahkan sendiri, tetapi bentuk keterlibatannya berbeda
Hasil eksperimennya sejauh ini cukup baik. Artinya, meski tahu esai dan makalah yang dihasilkan ditulis oleh agen AI, membacanya sering kali tetap menarik. Tentu saja saya tidak berencana menerbitkan atau membagikannya
- Saya memakai alat AI untuk hiburan atau pertanyaan acak, tetapi hampir sama sekali tidak untuk pekerjaan nyata
  Saya bertanya-tanya apakah saya akan termasuk dalam kelompok yang makin langka, yaitu orang-orang yang benar-benar bisa melakukan sesuatu, sementara yang lain makin tidak kompeten
Pernyataan bahwa “peserta kelompok LLM menunjukkan kinerja lebih rendah daripada kelompok Brain-only di semua level: aktivitas otak, bahasa, dan skor” tidak mengejutkan, tetapi suram
- Tampaknya selaras dengan paradoks otomasi yang lama [1]
  Ketika manusia hanya berperan meninjau hasil dan memberi cap persetujuan, umumnya mereka melakukannya dengan buruk
  Saya sudah cukup lama berpikir bahwa cara berpartisipasi adalah kunci untuk membuat workflow augmentasi yang sejati. Meninjau kode yang ditulis LLM? Kurang bagus. Kalau LLM mengamati perubahan saya dan memberi feedback? Ceritanya sama sekali berbeda. Mungkin sulit dan tidak terlalu populer, tetapi kalau kita tidak tetap berada di kursi pengemudi dengan satu atau lain cara, rasanya masa depannya cukup suram
  [1]: https://en.m.wikipedia.org/wiki/Ironies_of_Automation
- “Kita harus menolak mesin-mesin yang berpikir. Manusia harus menetapkan pedomannya sendiri. Ini bukan sesuatu yang bisa dilakukan mesin. Penalaran bergantung pada pemrograman, bukan perangkat keras, dan kitalah program pamungkas! Jihad kita adalah ‘dump program’. Membuang hal-hal yang menghancurkan kita sebagai manusia!”
  https://dune.fandom.com/wiki/Butlerian_Jihad
Efek samping yang agak tidak terduga sejak kini saya melakukan sebagian besar coding dengan AI adalah saya jauh lebih tidak lelah dan bisa fokus lebih lama
Ini memungkinkan saya menyelesaikan pekerjaan bahkan saat ada gangguan lain. Pada dasarnya, ketika sebagian kapasitas mental dialihkan ke AI, kapasitas di tempat lain menjadi lowong
- Saya justru kebalikannya. Saya menjadi jauh lebih produktif dan mengerjakan banyak hal secara paralel, lalu di akhir hari saya sangat lelah seolah otak bekerja dengan kapasitas 100%
- Di satu sisi, AI mengurangi kelelahan jangka pendek, tetapi jika tidak hati-hati, ada juga titik belok yang justru memperbesar kelelahan pada skala waktu yang lebih panjang
  Dulu, hal-hal seperti error tak terduga atau mengecek dokumentasi berfungsi sebagai “polisi tidur” yang membuat saya mengatur napas, dan biasanya saat itu saya menyadari betapa lelahnya saya lalu berhenti sejenak
  Dengan AI, polisi tidur seperti itu masih ada, tetapi kadang ada sedikit dorongan tambahan sehingga saya tidak cukup melambat untuk menyadari seberapa lelah saya
  AI bahkan tidak perlu benar. Membaca saran yang disesuaikan dengan situasi saat ini saja kadang memicu alur pikir saya, sehingga sulit untuk menahannya kembali
- Saya suka memikirkan AI seperti mobil
  Kita bisa berjalan kaki ke Walmart di luar kota, membawa barang, lalu pulang, tetapi memakai mobil jauh lebih cepat dan tidak terlalu melelahkan. Dengan begitu, kita bisa memakai lebih banyak waktu berkualitas untuk hal-hal yang kita sukai
Pada masa GAN sedang populer, saya melatih model generator-diskriminator untuk pembuatan gambar
Setelah banyak memikirkannya, saya menyadari bahwa mendiskriminasi jauh lebih mudah daripada menghasilkan
Misalnya, saya bisa membedakan UI yang baik dan UI yang buruk, tetapi meski nyawa saya dipertaruhkan, saya tidak bisa membuat UI yang baik. Saya langsung tahu apakah sebuah film bagus, tetapi menulis cerpen yang layak adalah pekerjaan berat
Saya bisa menilai seberapa realistis sebuah gambar, tetapi bahkan menggambar satu sepeda sederhana dengan cukup meyakinkan bagi orang lain pun saya tidak bisa
Dalam banyak kasus, kita bisa menilai apakah hasil LLM baik atau buruk. Maka strategi kasarnya adalah membuang hasil buruk dan terus menghasilkan sampai tujuan tercapai. Yang membuat LLM berguna adalah kesenjangan antara diskriminasi dan generasi ini
Kedua keterampilan ini terpisah. Kemampuan generatif sulit dipelajari dan sangat bernilai. Jika tidak terus dilatih, kemampuan itu akan menyusut
- Untuk kasus yang sangat sederhana, misalnya membedakan gambar yang jelas buruk dan gambar yang baik, saya rasa itu benar
  Namun untuk tugas yang lebih kompleks, terutama area yang membutuhkan evaluasi mendalam, belum tentu begitu. Misalnya, meninjau 5 PR yang tidak sepele kemungkinan lebih sulit dan memakan waktu lebih lama daripada menulisnya sendiri
  Alasan ini bekerja baik pada gambar atau cerita pendek adalah karena filter yang diterapkan bukan “baik vs buruk”, melainkan saya suka vs saya tidak suka
Saya rasa kemungkinan besar kita akan belajar membangun hubungan yang lebih sehat dengan teknologi semacam ini. Soal waktunya, saya tidak tahu. Bisa memakan beberapa generasi, bisa juga terjadi lebih cepat dari yang kita kira
Jelas bahwa model bahasa adalah akselerator murni. Namun jika orang rata-rata menjadi lebih “pandai berbicara”, maka sinyal yang menunjukkan kecerdasan mentah juga akan berubah seiring waktu
Tidak ada yang ingin menjalin hubungan dengan model bahasa. Namun model bahasa bisa membantu orang-orang yang belum siap menghadapi perubahan besar dalam hidup dan kekecewaan. Ini adalah alat, dan kita hanya perlu tahu cara menggunakannya
Sebagai contoh nyata, mari lihat nasihat percintaan. Seiring waktu, saya kira “hubungan yang dipandu ChatGPT” akan terbagi menjadi dua jenis. Yang pertama adalah tipe “salin-tempel” yang hanya menambah kompleksitas pada komunikasi yang sejak awal memang kurang, yaitu tipe “aku cuma menyalin apa yang dikatakan ChatGPT”; yang kedua adalah tipe “terakselerasi” yang memakai ChatGPT untuk menganalisis motivasi diri sendiri dan pasangan, lalu mencari solusi yang lebih baik untuk masalah umum
Untuk menilai yang kedua dengan benar, tetap dibutuhkan otak dan empati. Yang pertama akan selalu berakhir dengan patah hati. Saya percaya orang-orang pada akhirnya akan memahami perbedaan ini
- Saya tidak yakin dengan pernyataan “tidak ada yang ingin menjalin hubungan dengan model bahasa”
  Saya tidak punya pengalaman langsung maupun tidak langsung, tetapi saya sudah banyak mendengar kasus orang yang benar-benar terlibat dalam semacam hubungan dengan AI, dan saya juga bisa cukup memahami daya tariknya. Kita bisa memiliki “seseorang” yang sama sekali tidak menghakimi, selalu ada saat kita ingin bercerita, dan tidak menuntut apa pun dari kita. Ini sama sekali berbeda dari hubungan nyata, tetapi secara objektif lebih baik daripada hubungan manusia yang paling buruk, dan mungkin juga lebih baik bagi kesehatan mental daripada kesepian
  Baik atau buruk, dalam 10 tahun ke depan hubungan manusia-AI tampaknya akan meningkat pesat. Di satu sisi ada peningkatan dalam memori dan kemampuan perencanaan jangka panjang, bahkan mungkin tubuh robot; di sisi lain ada meluasnya epidemi kesepian
Ini disebut offloading kognitif. Siapa pun yang sudah cukup lama bekerja dengan alat bantu coding akan mengenalinya
- Atau juga bisa dikenali jika bekerja sebagai engineering manager
  Ini adalah konsekuensi tak terhindarkan ketika bekerja pada tingkat abstraksi yang lebih tinggi. Ini bukan akhir dunia. Kemampuan assembly saya juga sudah berkarat

Utang kognitif yang menumpuk saat menulis esai dengan asisten AI

Biaya kognitif LLM yang diukur dalam penulisan esai

Peserta dan desain sesi

Metode pengukuran

Hasil EEG: semakin banyak dukungan eksternal, semakin rendah konektivitas otak

Karakteristik esai yang terlihat dari analisis bahasa

Rasa kepemilikan, memori, dan kemampuan mengutip

Perbedaan dalam eksperimen peralihan sesi ke-4

Kesimpulan dan keterbatasan

Bacaan terkait

1 komentar

Komentar Hacker News