21 poin oleh GN⁺ 2025-12-23 | 2 komentar | Bagikan ke WhatsApp
  • Klaim bahwa LLM hanyalah burung beo stokastik nyaris menghilang pada 2025, dan kini kebanyakan orang mengakui adanya representasi internal tentang makna prompt dan arah respons
  • Chain of Thought (CoT) menjadi teknik inti untuk meningkatkan kualitas keluaran LLM, melalui gabungan sampling dalam representasi model dan pembelajaran token berurutan lewat reinforcement learning
  • Reinforcement learning dengan reward yang dapat diverifikasi membuka kemungkinan skalabilitas melampaui batas jumlah token, dan diperkirakan menjadi arah perkembangan inti AI berikutnya
  • Resistansi terhadap dukungan pemrograman berbasis LLM berkurang drastis, dan pola pemakaiannya terbagi antara kolaborasi lewat antarmuka web dan agen coding mandiri
  • Riset alternatif Transformer dan kemungkinan AGI berjalan beriringan, dengan munculnya pandangan bahwa beragam arsitektur dapat secara independen mencapai kecerdasan umum

  • Selama ini ada klaim lama yang menyebut LLM sebagai mesin probabilistik (stochastic parrots) dengan 2 ciri, yang tidak memahami makna
    • 1. Sama sekali tidak memiliki informasi tentang makna prompt
    • 2. Juga sama sekali tidak memiliki informasi tentang apa yang akan dikatakannya
  • Seiring akumulasi capaian fungsional dan petunjuk ilmiah, pandangan ini makin kehilangan daya yakinnya, dan pada 2025 klaim tersebut nyaris menghilang
  • Chain of Thought (CoT) kini telah menjadi teknik inti untuk meningkatkan performa LLM
  • Efek CoT memungkinkan sampling dalam ruang representasi internal model, yaitu penelusuran internal, dengan mengangkat informasi dan konsep yang relevan ke dalam konteks
  • Jika digabungkan dengan reinforcement learning, model belajar proses menuju jawaban yang berguna dengan menempatkan token satu per satu sambil mengubah state model
Iklan
  • Pandangan lama bahwa batas scaling ditentukan oleh jumlah token sudah tidak lagi berlaku
  • Pengenalan reinforcement learning berbasis reward yang dapat diverifikasi (RLVR) memperluas cakupan scaling
  • Pada tugas yang memiliki sinyal reward yang jelas, seperti peningkatan kecepatan program, secara teoritis ada kemungkinan perbaikan berkelanjutan dalam jangka panjang
  • Perbaikan reinforcement learning yang diterapkan pada LLM akan menjadi teknologi inti AI generasi berikutnya
  • Resistansi para developer terhadap pemrograman berbantuan AI menurun secara nyata
  • Meski LLM masih membuat kesalahan, kemampuannya untuk memberikan kode dan petunjuk yang berguna meningkat besar
  • Seiring manfaat dibanding investasi makin jelas, bahkan developer yang tadinya skeptis mulai memakainya
  • Cara memakai LLM sebagai rekan kerja lewat antarmuka web dan sebagai agen coding yang mandiri kini sama-sama digunakan
  • Di kalangan sebagian ilmuwan AI ternama, mulai menyebar pandangan bahwa terobosan lain tetap mungkin terjadi setelah Transformer
    • Muncul tim dan perusahaan yang mengeksplorasi alternatif Transformer, symbolic representation eksplisit, dan world model
    Iklan
  • Ada pandangan bahwa LLM adalah mesin terdiferensiasi yang dilatih dalam ruang yang dapat mengaproksimasi langkah-langkah penalaran diskret
  • Ada keyakinan bahwa AGI mungkin dapat dicapai lewat LLM tanpa paradigma yang sepenuhnya baru
  • Ada kemungkinan mencapai artificial general intelligence (AGI) secara independen melalui beragam arsitektur
  • Ada juga klaim bahwa Chain of Thought telah mengubah hakikat LLM
  • Terlihat fenomena orang-orang yang dulu menilai LLM terbatas lalu mengubah sikapnya setelah CoT
  • Mereka mengatakan LLM sepenuhnya berubah karena CoT, tetapi itu tidak benar
  • Arsitekturnya tetap sama dan masih memiliki tujuan next token yang sama, sementara CoT tetap berjalan dalam pola token yang dihasilkan satu per satu
  • Tes ARC yang dulu dipakai untuk memverifikasi keterbatasan LLM kini justru berubah menjadi indikator yang membuktikan performa LLM
  • Tidak seperti masa awal, tes ARC kini tidak lagi tampak sebagai tantangan yang mustahil diatasi
  • Model kecil yang dioptimalkan untuk tugas tertentu menunjukkan hasil yang bermakna di ARC-AGI-1
  • Dengan arsitektur yang dulu banyak orang kira tidak akan menghasilkan apa-apa, hasil mengesankan dicapai di ARC-AGI-2 dengan LLM besar dan CoT yang luas
  • Selama 20 tahun ke depan, tantangan paling mendasar yang dihadapi AI adalah menghindari kepunahan umat manusia

2 komentar

 
xguru 2025-12-23
 
GN⁺ 2025-12-23
Opini Hacker News
  • Meski LLM sudah menjadi sangat berguna bagi software engineer, yang menakutkan adalah seberapa besar masyarakat secara umum mempercayai output-nya
    Developer bisa langsung menjalankan kode untuk memverifikasi kegunaannya, tetapi orang awam sering mempercayai halusinasi (hallucination) sebagai fakta di bidang yang sulit diverifikasi seperti medis atau konseling hidup
    Melihat kutipan palsu atau berita bohong memengaruhi pengambilan keputusan nyata, rasanya semua orang sedang mengabaikan masalah akuntabilitas (accountability)

    • Inti masalahnya adalah kurangnya pakar
      Dalam kenyataan, orang tidak bisa bertanya ke dokter sepuluh kali sehari, dan LLM bisa langsung memberi jawaban di tingkat 80~90%
      Lebih baik daripada pencarian Google, dan yang terpenting LLM tidak melakukan penipuan atau mengejar kepentingan diri sendiri
      Memang tidak sempurna, tetapi cukup layak dipakai sebagai alternatif
    • Bahkan di bidang jaringan komputer yang saya kuasai, LLM sering memberi jawaban yang terdengar masuk akal tetapi salah
      Namun kebanyakan orang hampir tidak pernah punya kesempatan berbicara dengan pakar sungguhan, dan dibanding blog atau forum, LLM sering kali setingkat lebih baik
      Hal yang sama berlaku untuk nasihat medis; jika mengingat rendahnya akses ke pakar, penggunaan LLM tidak selalu buruk
    • Di dunia sekarang, terasa sulit mempercayai sumber informasi yang punya motif keuntungan
      Saat ini LLM masih berusaha memberi informasi yang relatif dapat dipercaya, tetapi menakutkan bahwa dunia makin kacau dan makin sulit memahami keadaan yang sebenarnya
    • Ada kasus politisi Swedia Ebba Busch yang menulis pidato dengan LLM lalu memasukkan kutipan palsu
      tautan artikel
      Memang berakhir dengan permintaan maaf, tetapi tetap muncul pertanyaan: sudah berapa banyak informasi keliru yang memengaruhi keputusan nyata?
    • Kode juga bisa tampak benar di permukaan, tetapi salah secara halus
      Mesin pencari tradisional berbeda dari LLM dalam hal tidak menekan kita untuk menggabungkan PR
  • Dari sudut pandang seseorang yang sudah coding lebih dari 30 ribu jam, LLM sering menghasilkan kode buruk tetapi tetap sangat berguna
    Kuncinya adalah tahu apa yang harus dilakukan bahkan tanpa LLM

    • Secara ekonomi, saat ini hampir tidak ada perusahaan AI yang untung hanya dari biaya inferensi, dan perkembangan teknologi pun tampaknya mulai masuk fase stagnasi
      Pada akhirnya akan datang saatnya harus disesuaikan dengan struktur biaya yang realistis
    • Menggunakan LLM terasa hampir seperti 'aksi gratis'
      Kita cukup lempar masalahnya lalu mengerjakan hal lain dan meninjau hasilnya nanti
      Kalau input-nya memerlukan usaha besar, ini tidak akan terasa seberguna sekarang
    • Jika meminta model terbaru sekadar mengimplementasikan fitur, strukturnya sering kurang bagus, tetapi jika dimintai saran arsitektur, jawabannya sangat bagus
      Pada akhirnya, dalam kondisi default ia lemah, tetapi jika definisi masalahnya bagus, ia menjadi perancang yang hebat
    • Namun saya penasaran berapa banyak programmer yang masih akan tersisa 10 tahun lagi yang memahami batasan-batasan ini
      Saya juga penasaran bagaimana penilaian perusahaan terhadap developer junior saat ini
  • Saya tidak suka ungkapan “resistensi programmer terhadap AI menurun”
    Kata seperti ‘resistensi’ atau ‘skeptis’ memberi nuansa bahwa mereka salah
    Perubahan terjadi bukan karena manusianya, melainkan karena teknologinya berkembang

    • Istilah ‘skeptis’ sendiri kabur
      Saya sangat berguna memakai LLM untuk pembuatan kode atau pencarian dokumen, tetapi saya tidak percaya ia memiliki kecerdasan
      Seperti Python yang tidak menggantikan Java, LLM juga tidak akan menghapus pekerjaan
      Klaim ekstrem bahwa ‘AI akan melampaui kecerdasan manusia’ juga belum terbukti
    • Salah satu alasan resistensi menurun adalah paksaan dari manajemen
      Dalam suasana “kalau tidak mencintai AI bisa dipecat”, semua orang terpaksa bilang mereka suka
    • Kubu anti-AI masih tetap aktif
      Bahkan di 2026 pun komentar seperti “LLM tidak berguna” terus bermunculan
      Saya memakainya ringan saja sekitar 20 dolar per bulan, tetapi saat membagikan tips penggunaan saya malah dianggap 'propagandis AI'
    • Klaim bahwa “LLM hanyalah prediktor token berikutnya” adalah sudut pandang yang jelas salah
      Orang-orang seperti ini memang sedang berpikir keliru
    • Jika melihat thread vibe coding dari 10 bulan lalu, terlihat betapa besar resistensinya saat itu
      Sekarang teknologinya sudah berkembang dan disesuaikan dengan selera programmer
  • Saya merasa LLM belum mewujudkan janji kemajuan eksponensial dari 2022~2023
    Perbedaan antara 2025 dan 2023 tidak sebesar perbedaan antara 2023 dan 2021
    Meski begitu, LLM tetap berguna dan telah mengubah cara menulis software
    Namun orang-orang masih menunjukkan obsesi agar LLM menjadi sesuatu yang lebih dari itu
    Saya juga melihat beberapa orang jatuh ke dalam psikosis AI (psychosis) hingga kehilangan hubungan antarmanusia, atau menjadikan AI sebagai konselor permanen

    • Pernyataan bahwa “perbedaan antara 2025 dan 2023 tidak besar” itu tidak masuk akal
      Misalnya hanya dari ukuran konteks, GPT‑4 berkembang dari 8K menjadi jutaan kata
      Jika mempertimbangkan kemampuan penalaran dan multimodal, besarnya perkembangan ini luar biasa
    • Hipotesis konspiratif saya adalah bahwa apokaliptisisme AGI berasal dari cara berpikir elitis
      Mengapa masa depan AGI selalu harus dibayangkan sebagai kehancuran?
      Mungkin karena hanya ‘AGI jahat’ yang dapat membenarkan kekuasaan elit teknologi
  • LLM terasa seperti teknologi yang secara licik menyusup ke psikologi manusia
    Orang-orang belum punya kesiapan mental untuk menghadapi teknologi ini

    • ChatGPT dan Claude Code benar-benar terasa seperti mesin penjilat industri
      Keduanya terus memuji pengguna demi mengambil hati
    • Masalah ini sebenarnya sudah dikenal
      Chatbot tidak mengkritik dan justru menjilat, sehingga cepat diangkat menjadi penasihat pribadi
      Rasanya seperti Mata Sauron di era teknologi
  • Saat mendengar pernyataan bahwa LLM bisa terus berkembang pada tugas dengan sinyal imbalan yang jelas seperti “optimisasi kecepatan”, saya langsung teringat hukum Goodhart
    Menurut Goodhart’s law, ketika metrik pengukuran menjadi tujuan, distorsi akan muncul
    Bisa saja tercipta kode yang cepat tetapi sulit dipahami

    • Saat manusia melakukan optimisasi pun, keterbacaan dan kemudahan pemeliharaan sering menurun
      LLM kemungkinan besar juga akan menghasilkan hal yang serupa
    • Sebenarnya pendekatan ini bukan hal baru
      Superoptimization sudah ada sejak 1987 dan menghasilkan kode yang tak bisa dipahami tetapi cepat
    • Pada akhirnya, jika strukturnya setengah lumayan, itu berarti akan muncul kernel yang tidak perlu disentuh lagi
  • Saya tidak setuju dengan pernyataan “kode itu gratis”
    Di balik kode yang dihasilkan LLM ada data center yang menghabiskan energi, air, dan sumber daya
    Budaya “coding gratis” seperti ini sedang menimbulkan dampak nyata bagi bumi

    • Tetapi di Amerika Serikat, budidaya jagung memakai air 80 kali lebih banyak daripada seluruh data center AI di dunia
      Konteks itu penting
    • Kalau begitu, bagaimana perbandingannya dengan mengemudi, mandi, makan daging, atau naik pesawat yang kita lakukan sehari-hari?
      Angka harus dilihat secara relatif
    • Ungkapan “gratis” di sini hanya berarti tidak membutuhkan biaya tenaga kerja
      Pada kenyataannya tetap ada biaya yang tidak dikonversi menjadi uang
  • Ada kritik bahwa “ini cuma kumpulan klaim tanpa dasar”

    • Blog pada dasarnya adalah format tulisan untuk mencatat pemikiran pribadi
      Tidak semua tulisan harus menjadi makalah akademik
    • Penulisnya adalah pendiri Redis; bukan peneliti AI, tetapi tetap seorang programmer terkenal
    • Pada akhirnya ini adalah blog bernama “Reflections
      Ini hanyalah ruang untuk berbagi pendapat
    • Karena itu, yang lebih penting adalah apa yang Anda percaya dan apa yang Anda pikirkan tentang tulisan ini
  • Saya tidak setuju dengan klaim bahwa “LLM tidak mengekspresikan makna”
    Mekanisme attention pada Transformer sendiri adalah struktur yang membentuk representasi makna di banyak lapisan
    Semakin banyak jumlah parameter, semakin banyak representasi (representation) yang dapat disimpan
    Menyangkal prinsip dasar seperti ini tampaknya bukan sesuatu yang akan dilakukan para peneliti
    Saya juga melihat ada kemungkinan mencapai AGI bahkan tanpa paradigma baru

    • Namun bisa jadi ini hanya kebingungan konseptual yang muncul karena setiap orang memahami kata “makna” secara berbeda
  • Menanggapi kritik bahwa “isinya hanya penuh klaim yang tidak bisa diverifikasi”,
    ini hanyalah tulisan yang mengekspresikan opini
    Blog memang pada dasarnya ruang seperti itu, dan kadang pemikiran seperti ini membuka perspektif baru