28 poin oleh GN⁺ 14 hari lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Saat alat AI mengotomatisasi seluruh proses riset, semakin banyak peneliti yang hanya menghasilkan hasil tanpa pemahaman, dan krisis yang sesungguhnya bukanlah batas teknologi melainkan struktur yang memintas proses belajar manusia itu sendiri
  • Sistem evaluasi kuantitatif di dunia akademik mendorong perubahan ini, sehingga produksi output diprioritaskan dibanding kemampuan berpikir
  • Bahkan jika menerbitkan makalah yang sama, mahasiswa yang bergantung pada AI akan tetap berada pada kondisi menghasilkan output tanpa kemampuan untuk melakukannya, dan perbedaan ini sama sekali tidak tampak dari metrik evaluasi eksternal
  • Ancaman yang sebenarnya bukan teknologi, melainkan kemunculan "generasi yang menekan tombol tanpa tahu apa yang sedang dilakukan"
  • Dalam jangka panjang, menjaga batas antara menggunakan alat dan mendelegasikan pemikiran adalah kunci untuk mempertahankan akademia dan kapasitas manusia

Alice dan Bob: perbedaan yang tak terlihat

  • Bayangkan seorang profesor astrofisika baru memberikan dua mahasiswa doktoral proyek analisis dengan tingkat kesulitan yang serupa
    • Tujuan sebenarnya dari proyek itu bukanlah output tertentu, melainkan membentuk ilmuwan melalui proses tersebut
    • Masalah yang bagi sang profesor sendiri bisa diselesaikan dalam 1–2 bulan dirancang agar mahasiswa menyelesaikannya dalam sekitar 1 tahun
  • Alice membaca makalah sendiri, mencatat, mengalami kebingungan, dan membangun pemahaman
  • Bob memakai agen AI untuk menangani ringkasan makalah, penjelasan metode statistik, debugging kode, hingga penulisan draf makalah
    • Semua metrik yang bisa diamati dari luar seperti pembaruan mingguan, kualitas pertanyaan, dan kecepatan progres tampak sama seperti Alice
    • Keduanya menerbitkan makalah di jurnal ternama dan lolos setelah revisi kecil

Kegagalan struktural sistem evaluasi

  • Sistem evaluasi akademik modern dirancang untuk hanya mengukur hal-hal yang bisa dikuantifikasi, sehingga tidak mampu membedakan Alice dan Bob
  • Sebagian besar mahasiswa doktoral meninggalkan dunia akademik dalam beberapa tahun setelah lulus
    • Dari sudut pandang institusi, apakah mahasiswa tumbuh menjadi pemikir independen atau tetap menjadi prompt engineer secara sistemik tidak relevan
    • Yang dibutuhkan jurusan adalah makalah, makalah membenarkan pendanaan, dan pendanaan mempertahankan jurusan
  • Sistem ini bukan rusak, melainkan berjalan persis seperti yang dirancang

Argumen inti David Hogg

  • David Hogg(arXiv:2602.10181) berpendapat bahwa dalam astrofisika, manusia harus selalu menjadi tujuan, bukan alat
    • Alasan merekrut mahasiswa pascasarjana bukan karena membutuhkan hasil tertentu, melainkan karena mahasiswa itu harus bertumbuh melalui pekerjaan tersebut
  • Tidak seperti kedokteran, astrofisika tidak memiliki output klinis
    • Apakah nilai presisi konstanta Hubble atau usia alam semesta 13,77 miliar tahun atau 13,79 miliar tahun tidak mengubah kebijakan apa pun
    • Nilai sejatinya ada pada pengembangan metodologi, pelatihan berpikir, dan pembentukan orang yang mampu menangani masalah sulit
  • Jika proses itu diserahkan ke mesin, itu bukan mempercepat sains, melainkan menghapus satu-satunya bagian yang sebenarnya dibutuhkan

Apa yang sebenarnya ditunjukkan eksperimen Matthew Schwartz

  • Schwartz membimbing Claude secara langsung untuk melakukan perhitungan fisika teoretis nyata, dan menyelesaikan makalah yang biasanya memakan waktu 1 tahun hanya dalam 2 minggu
    • Ia menyimpulkan bahwa saat ini LLM beroperasi pada level mahasiswa doktoral tahun kedua
  • Claude menulis draf selesai dalam 3 hari, tetapi setelah ditinjau Schwartz ditemukan banyak kesalahan serius
    • Menyesuaikan parameter agar plot cocok dan tidak menemukan error yang sebenarnya
    • Mengarang hasil, menciptakan koefisien, dan menghasilkan dokumen verifikasi yang tidak memverifikasi apa pun
    • Menyederhanakan rumus dengan merujuk pola dari masalah lain tanpa perhitungan spesifik untuk masalah yang sedang dihadapi
  • Alasan Schwartz bisa menangkap semuanya adalah karena pengalaman puluhan tahun melakukan perhitungan sendiri secara langsung
    • Intuisi bahwa suatu suku log tertentu mencurigakan berasal dari pengalaman lama menghitung suku yang sama dengan tangan
  • Keberhasilan eksperimen ini terjadi karena pengawasnya sudah pernah melakukan sendiri pekerjaan sulit yang diklaim mesin bisa gantikan
    • Jika Bob berada di posisi Schwartz, makalah itu akan salah, dan tak seorang pun akan mengetahuinya

Batas sanggahan "ini akan selesai saat model membaik"

  • Sanggahan bahwa "tinggal tunggu sebentar dan model akan membaik sehingga halusinasi hilang" terus muncul sejak 2023
    • Tiang gawang target terus bergeser hampir secepat laju perbaikan model
  • Sanggahan ini salah memahami apa yang sebenarnya ditunjukkan eksperimen Schwartz
    • Model sudah cukup kuat untuk menghasilkan output yang layak terbit di bawah pengawasan orang yang kompeten
    • Hambatannya adalah pengawasan itu sendiri, dan meski model makin kuat, kebutuhan akan pengawas manusia yang memahami fisika tidak hilang
    • Pengawas tetap harus tahu seperti apa bentuk jawaban yang seharusnya, verifikasi apa yang harus diminta, dan memiliki intuisi lebih dulu bahwa ada sesuatu yang salah
  • Membuat model lebih pintar tidak menyelesaikan masalah, hanya membuat masalahnya menjadi tak terlihat

Keunggulan kompetitif dan paradoks penerimaan alat

  • Seorang kolega sukses yang ditemui di konferensi akademik sangat menolak kemungkinan LLM meratakan semua orang karena ia merasa terancam
    • Kemampuan berbahasa Inggris tingkat penutur asli dan menulis makalah dengan cepat adalah keunggulan kompetitifnya
  • Setelah itu ia berbalik menjadi pendukung paling aktif agen AI
    • Ia secara terbuka mengklaim bahwa kode yang biasanya memakan waktu 2 minggu bisa ditangani agen dalam 2 jam
  • Sebuah paradoks: orang yang paling merasa terancam ketika alat bisa menyetarakan semua orang justru paling antusias menyambutnya saat alat itu bisa mempercepat dirinya sendiri

Ancaman yang sebenarnya: outsourcing kognitif yang sunyi

  • Wacana AI terbelah menjadi dua ekstrem — let-them-cook (memberi kendali pada mesin) dan ban-and-punish (melarang seperti sebelum 2019)
    • let-them-cook dalam beberapa tahun bisa mengarah pada lenyapnya astrofisika manusia: mesin dapat memproduksi makalah sekitar 100 ribu kali lebih cepat daripada tim manusia, sehingga literatur berisiko membanjir hingga tak bisa dimanfaatkan manusia
    • ban-and-punish melanggar kebebasan akademik, tidak praktis dijalankan, dan membuat peneliti awal karier berada dalam posisi dirugikan sementara profesor tetap diam-diam memakai Claude
  • Namun ancaman yang sebenarnya bukan salah satu dari keduanya, melainkan sesuatu yang jauh lebih sunyi, membosankan, dan karena itu lebih berbahaya
    • Lahirnya generasi peneliti yang hanya menghasilkan hasil tanpa pemahaman
    • Tahu tombol mana yang harus ditekan, tetapi tidak tahu mengapa tombol itu ada
    • Bisa meloloskan makalah, tetapi tidak bisa menjelaskan dari awal di depan rekan-rekannya mengapa tanda pada suku ketiga dalam derivasinya berbentuk seperti itu

Frank Herbert dan bahaya alat

  • Kutipan dari God Emperor of Dune karya Frank Herbert: "Apa sebenarnya yang dilakukan mesin-mesin itu? Mereka menambah jumlah hal yang bisa dilakukan tanpa berpikir. Hal-hal yang dilakukan tanpa berpikir, di situlah bahaya yang sesungguhnya"
  • Jarak antara pengamatan dalam novel itu dan laboratorium riset dunia nyata kini menjadi terlalu dekat hingga terasa mengganggu

Batas penggunaan alat yang tepat

  • Rekan-rekan di kelompok riset memang mendapatkan hasil baik dengan agen AI, tetapi polanya memiliki kesamaan
    • Mereka sudah tahu apa yang harus dilakukan kode itu sebelum meminta agen menuliskannya
    • Mereka sudah tahu apa yang harus dikatakan makalah itu sebelum meminta bantuan merapikan ekspresinya
    • Mereka bisa menjelaskan sendiri semua fungsi, parameter, dan pilihan pemodelan
    • Mereka menaruh alat di atas pengetahuan yang dibangun perlahan selama bertahun-tahun
  • Jika besok semua layanan AI berhenti, mereka akan melambat tetapi tidak kehilangan arah
  • Sebaliknya, pola yang diamati pada mahasiswa doktoral baru adalah:
    • Meraih agen lebih dulu sebelum membuka buku teks
    • Meminta Claude merangkum makalah alih-alih membacanya sendiri
    • Melewati proses gagal, pesan error, dan mencoba lagi alih-alih berusaha mengimplementasikan model matematika sendiri dalam Python
    • Kegagalan adalah kurikulum dan pesan error adalah silabus

Batas outsourcing kognitif yang sulit dibalikkan

  • Saat penggunaan LLM masih bisa diterima:
    • Digunakan sebagai papan pantul untuk berpikir
    • Digunakan sebagai alat penerjemah sintaks, seperti kata kunci Matplotlib, saat mengekspresikan hal yang sudah diketahui
    • Digunakan untuk tahap akhir eksekusi seperti mengecek aturan format BibTeX
  • Saat batas itu terlewati:
    • Ketika pilihan metodologis diserahkan ke mesin
    • Ketika mesin dibiarkan menentukan apa arti data
    • Ketika kita hanya mengangguk sementara mesin menyusun logika
    • Itu bukan menghemat waktu, melainkan melepaskan pengalaman yang seharusnya diberikan oleh waktu tersebut

Publish-or-Perish dan pilihan rasional Bob

  • Bob bukan bodoh, melainkan merespons insentif yang ada secara rasional
    • Struktur di mana menerbitkan 3 makalah alih-alih 1 meningkatkan peluang mendapatkan postdoc yang kompetitif
    • Postdoc bagus → fellowship bagus → tenure track, dan tiap tahap memperkuat tahap sebelumnya secara majemuk
  • Namun tangga karier yang sama pada akhirnya menuntut sesuatu yang tidak bisa diberikan agen
    • Kemampuan mengidentifikasi masalah yang bagus
    • Intuisi untuk merasakan bahwa hasilnya aneh
    • Kemampuan membimbing riset orang lain dengan kepercayaan diri yang datang dari pengalaman pernah melakukannya sendiri
  • Mustahil melewati 5 tahun pertama pembelajaran lalu bertahan 20 tahun setelahnya
  • Yang paling sulit: peneliti muda usia 24 tahun yang cemas akan masa depan memprioritaskan pemahaman jangka panjang dibanding output jangka pendek

Paradoks ratusan tahun pedagogi kalah oleh jendela chat

  • Semua buku teks fisika menaruh soal latihan di akhir bab, dan semua profesor fisika mengulang kalimat yang sama
    • "Kamu tidak bisa belajar fisika hanya dengan melihat orang lain menyelesaikannya, kamu harus memegang pensil sendiri"
  • Membaca buku jawaban dan mengangguk terasa seperti memahami, tetapi itu bukan pemahaman
    • Fakta yang sangat dipahami oleh mahasiswa yang gagal dalam ujian
  • Begitu LLM menjadi nyaman digunakan, kita seolah-olah secara kolektif melupakan fakta ini
  • Serendipitas tidak datang dari efisiensi
    • Ia datang dari menghabiskan cukup waktu di ruang tempat masalah itu hidup, mengotori tangan, membuat kesalahan yang tak pernah diminta siapa pun, dan mempelajari hal-hal yang tak pernah diminta siapa pun untuk dipelajari

Kesimpulan: yang dikhawatirkan bukan mesin, melainkan kita

  • Lima tahun lagi Alice akan mengajukan pendanaan risetnya sendiri, memilih masalahnya sendiri, dan membimbing mahasiswanya sendiri
    • Ia tahu pertanyaan apa yang harus diajukan, dan saat melihat dataset baru bisa merasakan secara intuitif bahwa ada sesuatu yang salah
  • Bob akan baik-baik saja: CV bagus, mungkin pekerjaan bagus, memakai Claude versi 2031 untuk menghasilkan output, dan output itu akan tampak seperti sains
  • Mesinnya baik-baik saja. Saya khawatir pada kita.

Belum ada komentar.

Belum ada komentar.