2 poin oleh GN⁺ 7 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • LLM bukanlah alat yang baik yang terasa menyatu seperti keyboard atau mobil, melainkan bekerja seperti lawan bicara yang menuntut permintaan dan negosiasi sehingga menguras energi sosial pengguna
  • Alat yang baik, berkat konsistensi dan kecepatannya, diterima otak sebagai perpanjangan tubuh, tetapi LLM seperti Claude atau Cursor masih belum mencapai tingkat itu
  • Pengguna LLM akhirnya harus meminta, membujuk, dan kadang marah seperti saat berbicara dengan manusia, sehingga membayar biaya sosial
  • Interaksi dengan manusia memberi imbalan seperti pembelajaran, tantangan, inspirasi, dan sanggahan, tetapi LLM kebanyakan hanya mengembalikan lebih banyak kode, lebih banyak pengujian, alasan, dan kadang laporan bug
  • Beberapa pekerjaan kini menjadi mungkin hingga ke tingkat yang sulit dilakukan satu orang setahun lalu, tetapi belum jelas apakah menghabiskan energi sosial pada LLM untuk semua tugas lebih baik daripada memakainya pada rekan kerja sungguhan

LLM yang menjadi lawan bicara, bukan alat

  • LLM terasa melelahkan karena membutuhkan energi sosial untuk mengoperasikannya
  • Energi itu mungkin lebih baik dipakai untuk interaksi dengan manusia yang nyata
  • Saat menggunakan alat yang baik, otak menerima alat itu seperti bagian dari tubuh
    • mengemudi mobil
    • mengetik dengan keyboard
    • menjalankan pekerjaan dengan menekan kombinasi tombol di Vim atau VSCode
  • Sebaliknya, saat berbicara dengan manusia, kita masuk ke dalam kesadaran sosial
    • berbincang
    • meminta bantuan
    • bekerja sama agar tiket tidak terdorong ke kuartal berikutnya
  • Kerja otak sosial seperti ini lebih sulit daripada sekadar memakai alat dan menuntut lebih banyak energi

Apa yang dikembalikan LLM dan imbalan yang kurang

  • LLM tidak memberi keajaiban alat seperti keyboard atau mobil
    • hampir tidak ada orang yang akan berkata bahwa Claude atau Cursor terasa seperti perpanjangan tubuh
    • konsistensi dan kecepatannya belum cukup sehingga otak sulit menerimanya sebagai alat
  • Sebagai gantinya, pengguna membayar pajak sosial dengan bercakap, bernegosiasi, membujuk, dan kadang marah kepada LLM
  • Mengeluarkan biaya sosial untuk manusia terasa layak karena memberi lebih banyak imbalan
    • bisa belajar hal baru atau ditantang
    • bisa mendapat inspirasi
    • jika kita bicara ngawur, lawan bicara bisa menolaknya
    • sebaliknya, kita juga bisa mengajar, menantang, atau menginspirasi orang lain
  • LLM kebanyakan mengembalikan lebih banyak kode, lebih banyak pengujian, dan lebih banyak alasan
    • kadang juga memberi lebih banyak laporan bug, dan itu ada nilainya
  • Dalam beberapa tugas, berkat LLM, satu orang kini bisa melakukan hal yang setahun lalu mustahil dilakukan
  • Namun, belum jelas apakah dalam semua tugas tepat untuk menghabiskan kerja otak sosial pada percakapan dengan LLM
  • LLM menuntut pengguna untuk mengajaknya bicara, tetapi jarang memberi imbalan yang sepadan dengan upaya itu

1 komentar

 
GN⁺ 7 jam lalu
Pendapat di Lobste.rs
  • Dalam kasus saya, berbicara dengan AI sudah seperti naluri kedua. Sekarang saya membuka sekitar 10 chat sehari untuk berbagai macam pertanyaan, dan hampir tidak sadar melakukannya
    Alurnya—memasukkan pertanyaan, membaca, menjawab, lalu membaca lagi—mirip seperti mencari sesuatu di Google. Seperti mengemudi yang tangan bergerak sendiri, bercakap dengan AI juga mulai menempati posisi yang sama, setidaknya bagi saya

    • Saya juga memakainya dengan cara serupa, tapi belakangan makin sering dibarengi dengan pencarian Brave. Ada kesan bahwa jika terlalu bergantung pada LLM, kemampuan riset bisa menurun dalam jangka panjang
      Karena terlalu banyak pekerjaan mencari sumber dan merangkai pengetahuan diambil alih olehnya. Tentu tidak masalah kalau hanya ingin cepat mendapatkan jawaban yang tidak terlalu penting, tapi secara umum menurut saya kemampuan riset harus tetap dijaga tetap tajam
    • Saya tidak memasukkan ini ke dalam alur vibe coding yang umum. Setuju. Buat saya juga, kalau cuma membuka chat seperti melakukan pencarian Google untuk mencari sesuatu, menjaga pertanyaan tetap singkat, dan tidak memulai percakapan bolak-balik yang panjang, rasanya cukup ringan
      Saat punya pertanyaan tertentu saya juga bertanya ke codebase, tapi bagi saya itu lebih mirip bertanya ke rekan kerja. Karena saya harus memikirkan cara merumuskannya, kadang perlu bertanya lagi dengan lebih spesifik, dan sesekali menerima jawaban palsu sehingga harus memperbaiki redaksinya lagi
    • Mengingat LLM sering berhalusinasi, saya tidak melihat itu sebagai hal yang baik. Saya ingat pernah melihat riset yang menyebut hampir setengah dari respons LLM tidak akurat, dan rasanya angka itu pun belum banyak membaik sejak saat itu
      Bergantung pada cara pemakaiannya, kita bisa nyaris menyerahkan proses berpikir sepenuhnya sehingga ada risiko penurunan kemampuan. Kita seharusnya berusaha lebih sedikit bergantung pada LLM, bukan lebih banyak
  • Soal “imbalan”, saya melihat sesuatu yang menarik beberapa hari lalu. Saya bekerja dengan dua programmer junior, dan ini keseimbangan yang cukup sulit bagi saya. Saya suka menyemangati orang, tetapi saat membimbing junior saya juga harus menilai hasil kerja mereka secara kritis
    Jadi saya mencari kesempatan untuk memuji, tetapi saat meninjau pekerjaan yang mereka buat dengan sangat bergantung pada LLM, saya sadar LLM telah mengambil kesempatan saya untuk memberi pujian dan membantu pertumbuhan mereka. Saya tidak bisa membedakan bagian mana yang dihasilkan, dan bagian mana yang benar-benar hasil pembelajaran mereka sendiri
    Akhirnya saya malah mengkritik pekerjaan yang dilakukan LLM sambil berkata “suruh LLM melakukan lebih banyak/lebih sedikit”, atau lawan bicara menjadi defensif dengan mengatakan “tapi LLM bilang begini”. Jujur saja, ini membuat saya memikirkan kembali nilai code review itu sendiri. Sekarang ketika semua orang punya “teman ngoding” virtual masing-masing, rasanya kesempatan berbagi pengetahuan lewat code review jadi berkurang

    • Jika LLM terlibat, pendekatannya memang harus berubah. Sekarang ada dua lapisan dalam review: perubahan kode itu sendiri, dan cara alat dipakai untuk menghasilkan perubahan tersebut
      Keduanya sama-sama bisa diberi umpan balik, tetapi untuk wilayah kedua belum ada benar-benar pakarnya, jadi lebih terasa seperti kolaborasi. Meski begitu, aturan pertama tetap jelas. Jika seseorang tidak bisa menjelaskan alasan dan isi perubahan melampaui “karena LLM bilang begitu”, maka harus ditolak dan dikerjakan ulang
  • Saya setuju bahwa mengarahkan LLM itu melelahkan, tetapi tidak sebanding dengan mengemudi. Saya sudah lebih dari 30 tahun mengemudi secara legal, tetapi jika harus menyetir sepanjang jam kerja seharian, kemungkinan saya perlu libur keesokan harinya
    Bukan cuma harus khawatir soal kesalahan sendiri, nyawa juga bisa terancam karena kecerobohan dan ketidakmampuan pengemudi lain. Mungkin juga tergantung di mana Anda mengemudi 😅

    • Menurut saya itu jauh lebih dekat dengan fakta bahwa Anda dikelilingi orang asing yang melakukan sesuatu dengan konsekuensi fatal saat mereka mengoperasikan pengalaman pengguna itu, ketimbang sekadar soal kegunaan pengalaman pengguna mobil itu sendiri
  • Kalau mengikuti definisi alat dari penulis, Firefox rasanya tidak memenuhi syarat sebagai alat bagi saya, dan dengan standar itu Chromium justru aktif bersifat jahat dan bermusuhan
    Saya merasa pembahasan soal penghematan/pengurasan energi mental di sekitar LLM itu sangat multidimensi. Ada soal seberapa kuat seseorang langsung tertarik pada sisi bercakap seperti manusia versus sisi yang tidak punya pikiran yang berkelanjutan, lalu di atas itu ada kecenderungan introvert/ambivert/ekstrovert. Penting juga apakah cara berpikir seseorang dekat dengan bahasa linear atau tidak; bagi sebagian orang LLM bisa menggantikan proses berpikir, sementara bagi yang lain ia menggantikan pekerjaan menerjemahkan pikiran nyata ke dalam konvensi komunikasi manusia yang menjengkelkan. Ada juga perbedaan antara kecepatan membaca dan kecepatan mengetik
    Soal persona sosial dan percakapan bolak-balik yang dibahas tulisan itu, saya tidak pandai membaca orang dan juga tidak bisa “mengulang” manusia, jadi menyuruh LLM melakukan sesuatu sama sekali tidak terasa seperti percakapan antarmanusia. Saya bisa melihat bagian bertele-tele sebelum jawaban untuk memahami bagaimana ambiguitas dalam kalimat saya ditafsirkan, dan saya bisa menulis ulang permintaan terakhir sambil mempertahankan bagian awal percakapan untuk menghindari salah tafsir. Setelah itu saya bahkan bisa menyunting ulang respons LLM di riwayat untuk mengarahkan jawaban berikutnya
    LLM yang di-host mungkin kurang antusias dalam membiarkan kita menulis ulang sepenuhnya pemikiran yang berkaitan dengan keselamatan, tetapi itu hanya menambah satu alasan lagi untuk memakai model lokal saja. Fakta bahwa mereka adalah layanan hosting oligopoli, perubahan perilaku tanpa pemberitahuan, dan bobot tersembunyi saja sudah cukup menjadi alasan untuk dihindari
    Tentu saja, sekalipun manipulasi seperti ini bisa dilakukan pada manusia, itu tetap buruk. Manusia punya kepribadian yang bertahan lama. Karena itu, berbicara dengan alat yang memang tidak dirancang memiliki pikiran berkelanjutan kadang justru tidak terlalu melelahkan. Kalau saya bicara terlalu singkat dan kaku pun, alat tidak akan tersinggung
    Dan bukankah saran saat ini hampir selalu bahwa daripada meninggalkan kesalahan konteks lalu harus menjelaskannya seperti dalam percakapan manusia, lebih baik menulis ulang kueri awal untuk mencegah kesalahan sejak awal?

  • Saya suka berbicara dengan Claude, dan karena ia dilatih agar sangat menyenangkan sesuai preferensi manusia, saya rasa banyak orang lain juga akan merasakan hal yang mirip