- Studi ini menganalisis dampak penggunaan LLM (large language model) terhadap biaya kognitif manusia dalam proses penulisan esai
- Peserta dibagi ke dalam kelompok LLM, kelompok mesin pencari, dan kelompok Brain-only lalu mengikuti eksperimen penulisan esai sesuai ada atau tidaknya penggunaan alat
- Hasil analisis EEG menunjukkan bahwa saat menggunakan LLM, konektivitas jaringan saraf dan tingkat keterlibatan kognitif adalah yang terendah, sedangkan kelompok Brain adalah yang tertinggi
- Setelah menulis esai, kelompok LLM menunjukkan hasil terendah dalam rasa kepemilikan (ownership), kemampuan mengutip, dan ingatan kembali
- Temuan ini menyiratkan bahwa penggunaan LLM memang efisien pada tahap awal, tetapi dalam jangka panjang dapat menurunkan kemampuan belajar dan kognitif
Abstrak
Saat ini, dengan adopsi luas produk large language model (LLM) seperti ChatGPT, baik individu maupun perusahaan telah memanfaatkan LLM dalam keseharian. Alat-alat ini memiliki keunggulan dan keterbatasan yang khas secara bersamaan. Studi ini berfokus pada pengungkapan biaya kognitif saat LLM digunakan dalam konteks pendidikan berupa penulisan esai, yakni bagaimana penggunaan LLM memengaruhi struktur kognitif pelajar dan aktivitas otak.
Untuk penelitian ini, peserta dibagi menjadi kelompok LLM, kelompok mesin pencari, dan kelompok Brain lalu menulis esai di setiap sesi dengan alat tersebut (atau tanpa alat). Sebanyak 54 orang mengikuti sesi 1–3, dan 18 di antaranya menyelesaikan hingga sesi 4. Pada sesi 4, kelompok LLM menulis tanpa alat, sedangkan kelompok Brain menggunakan LLM, sehingga perannya ditukar (LLM-to-Brain, Brain-to-LLM). Selama penulisan esai, sinyal EEG peserta direkam untuk menganalisis keterlibatan kognitif, beban, dan konektivitas saraf; setelah tiap sesi juga dilakukan wawancara, analisis NLP, serta penilaian oleh guru manusia dan agen penilai AI.
Hasil analisis menunjukkan homogenitas tinggi dalam tiap kelompok pada Named Entities Recognition (NER), n-gram, dan ontologi topik. Analisis gelombang otak menunjukkan bahwa pola konektivitas saraf sangat berbeda antar kelompok, dan semakin besar dukungan alat eksternal, semakin kecil skala jaringan otak dan tingkat keterlibatannya (urutan: Brain > mesin pencari > LLM). Pada sesi 4, peserta LLM-to-Brain menunjukkan konektivitas otak yang melemah, aktivasi jaringan alfa dan beta yang rendah, serta rasa kepemilikan topik yang rendah. Sebaliknya, pada peserta Brain-to-LLM diamati peningkatan kemampuan ingatan kembali dan reaktivasi area otak yang berkaitan dengan pemrosesan visual. Esai kelompok LLM rendah dalam rasa kepemilikan, kemampuan mengutip, dan ingatan kembali, sedangkan kelompok mesin pencari sedikit lebih baik tetapi masih di bawah kelompok Brain.
Kesimpulannya, penggunaan LLM memang memberi efek peningkatan produktivitas jangka pendek, tetapi bila diulang selama beberapa bulan, kelompok LLM secara konsisten tertinggal dibanding kelompok Brain dalam perilaku otak, pencapaian bahasa, dan skor. Studi ini menunjukkan bahwa penggunaan alat AI yang berlebihan dapat menyebabkan penurunan kognitif dan praktis di lingkungan belajar, sehingga diperlukan kehati-hatian dalam perancangan pembelajaran jangka panjang.
Ringkasan hasil utama eksperimen
- Pada sesi 4, peserta Brain-to-LLM menunjukkan konektivitas otak yang lebih tinggi (seluruh band seperti alfa, beta, theta, delta) dibanding kelompok LLM pada sesi 1–3. Ini menyiratkan bahwa jika AI digunakan setelah seseorang lebih dulu berlatih menulis sendiri tanpa bantuan AI, maka jaringan otak yang lebih luas dapat diaktifkan
- Pada peserta LLM-to-Brain, meskipun memiliki riwayat penggunaan LLM, saat menulis tanpa alat tetap diamati ketidakselarasan neurologis (penurunan konektivitas) pada sebagian besar gelombang otak dan bias kosakata yang khas LLM
- Berdasarkan penilaian AI maupun manusia, esai kelompok LLM memiliki keragaman NER/n-gram yang rendah dan secara struktural homogen
- Dalam analisis per topik, terlihat pola penggunaan yang berbeda secara bermakna pada topik tertentu (HAPPINESS, PHILANTHROPY) antara kelompok LLM dan kelompok Brain
- Urutan OWNERSHIP (rasa kepemilikan) dan kemampuan mengutip per kelompok adalah Brain > mesin pencari > LLM
Panduan daftar isi paper
- Ikhtisar cepat: Discussion, Conclusion
- Analisis NLP teks esai: NLP ANALYSIS
- Memahami data gelombang otak: EEG ANALYSIS
- Analisis mendalam per topik: TOPICS ANALYSIS
- Metode eksperimen rinci dan aktivitas peserta: EXPERIMENTAL DESIGN
- Lampiran: data tambahan, nilai EEG dDTF, dll.
Pendahuluan
Penyebaran large language model yang sangat cepat telah mengubah secara mendasar aspek keseharian seperti pekerjaan, hiburan, dan pembelajaran. LLM memiliki potensi besar di bidang pendidikan dalam hal personalisasi pengalaman belajar, umpan balik instan, dan demokratisasi materi pendidikan. Bahkan, telah dilaporkan adanya efek positif seperti meningkatkan otonomi pelajar, keterlibatan, dan dukungan terhadap gaya belajar yang dipersonalisasi.
Namun, efek samping kognitif dari penggunaan LLM secara luas juga mulai diangkat. Di satu sisi LLM mengurangi beban kognitif secara langsung, tetapi di sisi lain dilaporkan dapat menyebabkan penurunan kemampuan berpikir kritis, pelemahan analisis mendalam, dan berkurangnya keterlibatan. Terutama, semakin bergantung pada AI, kemampuan otak untuk menganalisis dan menilai dapat mengalami kemunduran. Studi ini juga menyoroti bahwa semakin muda generasinya, semakin tinggi ketergantungannya pada alat AI, dan seiring itu nilai performa kognitif juga cenderung lebih rendah.
Selain itu, ada temuan bahwa interaksi dengan AI mengurangi kesempatan individu untuk memecahkan masalah secara mandiri dan berpikir kritis, sehingga menimbulkan kekhawatiran bahwa dalam jangka panjang hal ini dapat berdampak negatif pada perkembangan intelektual dan otonomi manusia. Berbeda dari mesin pencari tradisional, LLM menghasilkan jawaban yang lebih terseragamkan alih-alih menyajikan beragam perspektif, sehingga cenderung menggeser pengguna dari penelusuran informasi yang aktif ke konsumsi yang pasif, dan diperkirakan turut memengaruhi cara pemrosesan serta evaluasi informasi dalam jangka panjang.
Studi ini secara empiris mengukur biaya kognitif penulisan esai dengan bantuan LLM. Menulis esai adalah tugas yang menuntut gabungan berbagai proses kognitif seperti menulis, mengorganisasi informasi, mengutip, dan berpikir kritis, serta sering digunakan di lingkungan pendidikan dan evaluasi standar. Studi ini menunjukkan bahwa dampak kognitif jangka panjang harus dipertimbangkan secara hati-hati saat alat AI seperti LLM diperkenalkan ke lingkungan pendidikan.
Desain eksperimen dan beberapa detail
- Di tiap sesi, peserta ditata ulang per kelompok atau kondisi penggunaan alat diubah untuk membandingkan kondisi LLM, mesin pencari, dan Brain (tanpa alat)
- Pada sesi 4, kelompok Brain-only pertama kali menggunakan LLM (Brain-to-LLM), sedangkan kelompok LLM menulis tanpa alat (LLM-to-Brain)
- Selama eksperimen, indikator EEG dan NLP, rasa kepemilikan atas esai, kemampuan kutip, dan keragaman per topik dievaluasi secara sistematis
- Analisis gelombang otak berfokus pada perubahan konektivitas otak fungsional seperti konektivitas jaringan saraf (analisis dDTF)
Ciri utama hasil eksperimen dan analisis
- Saat menggunakan LLM, keragaman gelombang otak dan bahasa menurun secara signifikan, sementara rasa kepemilikan terhadap pekerjaan, kemampuan ingatan kembali, dan kemampuan mengutip juga sama-sama menurun
- Kelompok Brain-only secara umum menunjukkan hasil unggul dalam aktivasi jaringan otak, keragaman bahasa, rasa kepemilikan, dan kemampuan kutip
- Pada sesi 4, peserta Brain-to-LLM menunjukkan perubahan kuat pada jaringan saraf otak, seperti peningkatan ingatan kembali dan reaktivasi area visual-frontal, dibanding sebelum alat diperkenalkan
- Secara keseluruhan, semakin tinggi ketergantungan pada AI, semakin besar kekhawatiran akan penurunan efisiensi kognitif dan hilangnya keaktifan dalam proses belajar
Makna kesimpulan
Paper ini membuktikan melalui data berlapis bahwa alat pembelajaran AI meski meningkatkan efisiensi dalam jangka pendek, dalam jangka panjang dapat berdampak negatif pada unsur inti pembelajaran seperti kemampuan kognitif, motivasi belajar, rasa kepemilikan, dan daya ingat. Ini menyiratkan bahwa saat merancang dan menerapkan teknologi pendidikan canggih seperti AI dan LLM, perlu ada pertimbangan yang cermat serta riset lanjutan mengenai utang kognitif dan penurunan kualitas belajar tersebut.
1 komentar
Opini Hacker News
Menurut saya, alih-alih istilah “cognitive debt”, penjelasan yang lebih tepat adalah penurunan kognitif atau hilangnya kemampuan kognitif; otak tidak menyimpan informasi yang tidak diperlukan. Jika melihat studi-studi lama terkait penggunaan Google Maps, penggunaan GPS yang sering menurunkan memori spasial, dan bahkan ada hasil yang menunjukkan jumlah materi abu-abu pada pengguna peta benar-benar berkurang. Siapa pun yang pernah membangun keahlian di bidang sains tahu bahwa untuk benar-benar memahami suatu konsep, kita harus cukup lama memikirkannya dan mendalami keterkaitan antargagasan. Membaca sekilas buku matematika tidak membuat orang mudah menguasai matematika. Kita harus berhenti dan berpikir mendalam. Saya rasa tindakan berpikir itu sendiri adalah proses menegakkan konsep dalam pikiran agar tetap berguna setelah waktu berlalu
Orang tidak menjadi paham matematika hanya dengan membaca buku matematika secara asal; kita harus berhenti dan berpikir. Dan yang paling penting adalah “menulis”. Dengan menulis, otak saya bisa menyusun pikiran. Menulis adalah alat untuk menciptakan dialog terstruktur antara saya dan diri saya sendiri. Ia memungkinkan eksplorasi berbagai jalur. Berpikir saja ada batasnya, tetapi menulis memungkinkan saya menjelajahi pikiran hampir tanpa batas. Aktivitas berpikir sangat terkait dengan menulis (dalam bentuk apa pun: teks, gambar, rumus, grafik, dan sebagainya), dan sekarang kita memasuki era ketika LLM makin sering menulis sebagai pengganti kita, jadi saya penasaran bagaimana dampaknya akan tercermin pada kemampuan kognitif saya
Saya rasa istilah cognitive debt itu tepat. Pernah menulis laporan besar dengan LLM? Saat LLM membangun struktur, membuat grafik, dan menyusun argumen dengan mudah, hasilnya perlahan menjadi sesuatu yang bukan benar-benar milik saya. Walau dikumpulkan atas nama saya, sering kali saya jadi canggung saat diminta menjelaskannya. Biasanya saya punya pemahaman tingkat lebih tinggi yang nyata di kepala saya, tetapi saat memakai LLM proses itu dilewati. Ketika benar-benar mencoba menjelaskan konsep intinya, saya jadi kesulitan. Pada akhirnya saya harus benar-benar mengalami sendiri proses membangun konsep esensial dalam kepala, mengulang dan mengubahnya, lalu menyampaikannya kepada audiens yang berbeda-beda. Cognitive debt menggambarkan perbedaan antara model mental yang dulu harus selalu saya bangun sebelum era LLM dan kedangkalan saat memakai LLM. Pada akhirnya nama saya ada di laporan itu, tetapi seiring waktu ada risiko orang akan makin menurunkan ekspektasi terhadap penulis, atau bahkan berharap LLM saja yang menjelaskan. Tiap LLM meniru realitas dengan model internal dan algoritme yang berbeda-beda, dan untuk prediksi yang paling akurat dibutuhkan cukup banyak 'kedalaman pemahaman'. Penulisan yang bergantung pada LLM tidak menghasilkan kedalaman ini. Dalam jangka panjang, itu bisa berujung pada penurunan kognitif atau hilangnya keterampilan pada seluruh populasi. Ketika mesin cetak muncul, para elite agama saat itu juga khawatir orang biasa tidak akan mampu membaca dan menafsirkan dengan benar, tetapi ternyata tidak begitu. Menulis memang adalah berpikir (dan saya rasa kita belum menemukan alat yang lebih baik daripada menulis), dan berpikir adalah proses membangun model mental berdasarkan informasi agar kita bisa memprediksi masa depan dengan lebih baik. Kelangsungan hidup kita sendiri bergantung pada itu. Dari sudut pandang teori informasi, “biology only makes sense in the light of information” tautan YouTube
Soal pernyataan “otak tidak menyimpan informasi yang tidak diperlukan”, saya penasaran kenapa saya masih ingat cara mengoptimalkan memori dengan
config.sysdanautoexec.batdi DOS, padahal sudah lebih dari 20 tahun tidak memakainya. Sepertinya saya juga tidak akan pernah memakai keterampilan itu lagi di masa depanIstilah seperti “cognitive decline” atau “brain rot” bisa terdengar terlalu sensasional, dan makalah terkait juga secara jelas menyebutkan keterbatasan berupa ukuran sampel yang kecil. Makalah itu tidak memberikan dasar atau sitasi untuk istilah “cognitive debt”, jadi judulnya terasa aneh. Kesan saya, seolah judulnya diganti di bagian akhir. Tetap saja ini hasil riset MIT yang menarik. Seperti semua riset psikologi, perlu skeptisisme yang sehat dan verifikasi independen. Rasanya seperti paket lengkap yang menggabungkan pencitraan otak dan psikometri. Saya juga menganggap sebagian besar gambar bertema ‘inilah otak Anda saat memakai LLM’ cukup lucu
Ketika mendengar pernyataan “otak tidak menyimpan informasi yang tidak diperlukan”, memang terdengar masuk akal, tetapi saya penasaran karena jelas ada fenomena keterampilan tertentu yang tidak hilang, seperti bersepeda yang sekali dipelajari lalu tidak terlupakan seumur hidup
Diskusi tentang “cognitive debt” ini tepat, tetapi menurut saya perlu sudut pandang yang lebih luas. Ini bukan sekadar soal sementara kehilangan atau lupa keterampilan seperti bahasa atau memori spasial. Yang dimaksud adalah fenomena ketika sirkuit saraf yang menangani penalaran integratif justru menyusut secara sistematis dan tidak dapat dipulihkan. Istilah “debt” memberi nuansa bahwa ini bisa dibayar kembali (dipulihkan) lewat latihan, tetapi bahaya sebenarnya adalah saat melewati “cognitive tipping point”. Jika terlalu banyak beban fungsi eksekutif, integrasi, dan argumentasi diserahkan ke sistem eksternal (LLM), otak bukan hanya akan tanpa ampun memangkas sirkuit yang tidak dipakai, tetapi juga berisiko kehilangan “kemampuan rekonstruksi” untuk memulihkannya kembali. Otak manusia adalah sistem “use-it-or-lose-it” tanpa version control. Begitu kemampuan kognitif kompleks hilang, seolah “source code”-nya sendiri yang rusak. Collapsed neural network tidak bisa di-
git revert. Komentar-komentar HN ini berfokus pada penulisan esai, tetapi sebenarnya seluruh masyarakat sedang menjalankan eksperimen besar yang tak terkendali untuk mengeksternalisasi kemampuan intelektual. Dalam jangka panjang, ada risiko masyarakat secara keseluruhan akan menghadapi keterbatasan struktural yang melampaui sekadar tidak punya keterampilan, yaitu sampai pada titik “cara berpikir seperti itu sendiri menjadi mustahil”. Jadi pertanyaan yang sebenarnya bukan cuma “bagaimana menghindari cognitive debt”, melainkan ketakutan akan “apakah kita memerlukan wadah baru untuk menampung pikiran kita ketika otak biologis mengoptimalkan dirinya sendiri dan teroptimasi secara fatal menuju kemalasan” tautan terkaitAI adalah kebalikan dari Zettelkasten (sistem pencatatan terhubung). Alih-alih manusia menggali topik secara mendalam untuk mendapatkan wawasan yang lebih dalam, yang terjadi di atas keluaran berbasis AI hanyalah pengulangan yang cepat tetapi dangkal. Misalnya, saya ingin memahami situasi Timur Tengah lalu menulis esai 10 halaman bersama OpenAI tentang asal-usul Hammas dan Hizbulah, tetapi tidak ada yang benar-benar tertinggal dalam ingatan saya. Bahkan untuk beberapa hal yang masih tersisa, saya pun tidak yakin apakah itu halusinasi AI yang saya koreksi atau fakta yang benar
Saya agak optimistis soal kegunaan LLM, tetapi saya setuju dengan poin di atas. Kita bisa membangun insting untuk menangani LLM dengan baik, tetapi itu bukan berarti membangun pengetahuan yang benar-benar bisa dijelaskan atau kemampuan berpikir yang menantang. Yang justru utama adalah menjadi terbiasa dengan “memori otot” terhadap pola keluaran tertentu, penyesuaian prompt, dan pengaturan konteks. Saya menilai “keterampilan” semacam ini akan cepat hilang begitu model menjadi lebih baik. Situasi ini agak mirip dengan rasa tak berdaya yang dirasakan pekerja lini perakitan
Bagian yang diedit langsung dengan tangan cenderung lebih membekas dalam ingatan. Dibanding bagian yang lewat begitu saja tanpa masalah, justru bagian yang saya sentuh langsung lebih saya ingat
Kebanyakan orang cerdas tahu bahwa menulis bukan sekadar untuk menghasilkan output, tetapi merupakan proses “berpikir”. Dalam proses seperti itu, LLM adalah partner sparring yang baik untuk menunjukkan kesalahan, menemukan celah atau kekeliruan, atau membantu riset umum dalam memahami dunia. Namun itu hanya berlaku ketika LLM dipakai sebagai bantuan dalam proses berpikir kita sendiri, bukan untuk “menulis menggantikan” kita. Meski begitu, hasilnya tetap harus selalu diverifikasi ke sumbernya
Secara pribadi, hasil riset ini tidak mengejutkan. Saat saya memakai AI untuk membantu penulisan atau penerjemahan saya, saya merasa lebih sedikit terlibat secara aktif atau mendalam dalam proses berpikir. Tetapi ketika saya memakai AI dengan cara yang sama sekali berbeda, saya justru merasa tingkat keterlibatannya sangat tinggi. Selama dua minggu saya mencoba Claude Code untuk pengembangan ide, riset, dan otomatisasi esai/makalah, dan selama proses itu saya tetap merasa terlibat secara mental seperti “menulis sungguhan” (meskipun sifatnya berbeda). Hasil eksperimen saya juga cukup bagus. Esai atau makalah yang ditulis AI pun, kalau dibaca langsung, tetap cukup menarik. Hanya saja saya tidak berniat memublikasikannya atau mengumpulkannya seperti makalah akademik
Fenomena ini disebut “cognitive offloading”, dan siapa pun yang cukup lama bekerja dengan coding assistant pasti akan memahaminya
Mirip dengan dampak perkembangan mekanisasi terhadap dunia industri manusia, ada baiknya memikirkan secara luas gelombang yang dibawa LLM dan teknologi baru lain pada struktur kognitif kita. Saya menganggap otomasi adalah soal menyerahkan pekerjaan yang berulang dan membosankan agar manusia punya energi dan waktu untuk bergerak ke hal yang lebih kreatif dan inovatif. Yang saya penasaran adalah apakah peningkatan penggunaan alat seperti LLM dan GPS bukan hanya mengubah kita dalam jangka pendek, tetapi juga bisa mengubah cara berpikir itu sendiri dalam jangka panjang. Generasi yang tumbuh akrab dengan mesin pencari mungkin memiliki daya hafal yang lebih lemah, tetapi beradaptasi dengan cara mengingat “bagaimana menemukan” informasi. Ini membuat saya bertanya-tanya apakah ini sekadar kelanjutan alami dari perkembangan yang menggantikan fungsi lama, atau justru ketergantungan pada LLM akan menyebabkan hilangnya keterampilan inti yang sama sekali tak bisa digantikan
Dalam kutipan di bawah, disorot bahwa “LLM telah menurunkan hambatan masuk untuk tanya-jawab, tetapi sebagai harga dari kenyamanan itu, pengguna menjadi kurang cenderung mendekati jawaban atau ‘opini’ LLM secara kritis (yang sebenarnya hanyalah estimasi probabilistik berdasarkan data pelatihan).” Pada akhirnya fenomena echo chamber bukan hilang, melainkan justru paparan pengguna direstrukturisasi secara sistematis ke konten yang “diprioritaskan untuk tampil” oleh algoritme. Dan “prioritas” itu sendiri mencerminkan nilai-nilai pemilik LLM (para pemegang saham)
Ini juga sesuatu yang belakangan terus saya pikirkan, dan karena itu saya hanya mencoba copilot sebentar. Saya masih di awal karier dan belajar setiap hari — dengan bantuan LLM saya bisa menyelesaikan pekerjaan lebih cepat, tetapi rasanya saya akan kehilangan kesempatan untuk benar-benar menyerap keterampilan dengan mudah. Saya tidak setuju dengan argumen bahwa “kemampuan berpikir kritis tingkat rendah akan makin tidak relevan dan ke depan kita hanya butuh perencanaan tingkat tinggi/abstrak”. Secara emosional pun saya merasa bangga dan bermakna karena “saya tahu sesuatu dan bisa melakukannya sendiri”. Saya tidak menganggap pemanfaatan LLM itu sulit, dan kalau perlu saya bisa memilih alat terbaru untuk dipakai, tetapi untuk sementara proses belajar dan berkembang sendiri terasa lebih berharga bagi saya
Menurut saya, dengan adopsi AI, masalahnya bukan hanya jumlah tenaga junior yang berkurang; bahkan tenaga junior yang tersisa pun berisiko tidak belajar apa-apa dan selamanya tetap junior karena terus memakai AI
Saat dipakai bersama AI, pada saat itu tulisan memang terasa mengalir lancar, tetapi saya juga merasa tidak benar-benar memikirkan idenya secara serius. Tulisan jadinya terdengar rapi, tetapi beberapa waktu kemudian saya sering tidak ingat kenapa saya menulis kalimat itu. Sekarang saya menulis draf awal sendiri terlebih dahulu, lalu setelah itu baru merapikannya dengan AI. Memang sedikit lebih merepotkan, tetapi saya jelas belajar lebih banyak dan mengingatnya lebih lama