Refleksi tentang AI di penghujung 2025
(antirez.com)- Klaim bahwa LLM hanyalah burung beo stokastik nyaris menghilang pada 2025, dan kini kebanyakan orang mengakui adanya representasi internal tentang makna prompt dan arah respons
- Chain of Thought (CoT) menjadi teknik inti untuk meningkatkan kualitas keluaran LLM, melalui gabungan sampling dalam representasi model dan pembelajaran token berurutan lewat reinforcement learning
- Reinforcement learning dengan reward yang dapat diverifikasi membuka kemungkinan skalabilitas melampaui batas jumlah token, dan diperkirakan menjadi arah perkembangan inti AI berikutnya
- Resistansi terhadap dukungan pemrograman berbasis LLM berkurang drastis, dan pola pemakaiannya terbagi antara kolaborasi lewat antarmuka web dan agen coding mandiri
- Riset alternatif Transformer dan kemungkinan AGI berjalan beriringan, dengan munculnya pandangan bahwa beragam arsitektur dapat secara independen mencapai kecerdasan umum
- Selama ini ada klaim lama yang menyebut LLM sebagai mesin probabilistik (stochastic parrots) dengan 2 ciri, yang tidak memahami makna
- 1. Sama sekali tidak memiliki informasi tentang makna prompt
- 2. Juga sama sekali tidak memiliki informasi tentang apa yang akan dikatakannya
- Seiring akumulasi capaian fungsional dan petunjuk ilmiah, pandangan ini makin kehilangan daya yakinnya, dan pada 2025 klaim tersebut nyaris menghilang
- Chain of Thought (CoT) kini telah menjadi teknik inti untuk meningkatkan performa LLM
- Efek CoT memungkinkan sampling dalam ruang representasi internal model, yaitu penelusuran internal, dengan mengangkat informasi dan konsep yang relevan ke dalam konteks
- Jika digabungkan dengan reinforcement learning, model belajar proses menuju jawaban yang berguna dengan menempatkan token satu per satu sambil mengubah state model
- Pandangan lama bahwa batas scaling ditentukan oleh jumlah token sudah tidak lagi berlaku
- Pengenalan reinforcement learning berbasis reward yang dapat diverifikasi (RLVR) memperluas cakupan scaling
- Pada tugas yang memiliki sinyal reward yang jelas, seperti peningkatan kecepatan program, secara teoritis ada kemungkinan perbaikan berkelanjutan dalam jangka panjang
- Perbaikan reinforcement learning yang diterapkan pada LLM akan menjadi teknologi inti AI generasi berikutnya
- Resistansi para developer terhadap pemrograman berbantuan AI menurun secara nyata
- Meski LLM masih membuat kesalahan, kemampuannya untuk memberikan kode dan petunjuk yang berguna meningkat besar
- Seiring manfaat dibanding investasi makin jelas, bahkan developer yang tadinya skeptis mulai memakainya
- Cara memakai LLM sebagai rekan kerja lewat antarmuka web dan sebagai agen coding yang mandiri kini sama-sama digunakan
- Di kalangan sebagian ilmuwan AI ternama, mulai menyebar pandangan bahwa terobosan lain tetap mungkin terjadi setelah Transformer
- Muncul tim dan perusahaan yang mengeksplorasi alternatif Transformer, symbolic representation eksplisit, dan world model
- Ada pandangan bahwa LLM adalah mesin terdiferensiasi yang dilatih dalam ruang yang dapat mengaproksimasi langkah-langkah penalaran diskret
- Ada keyakinan bahwa AGI mungkin dapat dicapai lewat LLM tanpa paradigma yang sepenuhnya baru
- Ada kemungkinan mencapai artificial general intelligence (AGI) secara independen melalui beragam arsitektur
- Ada juga klaim bahwa Chain of Thought telah mengubah hakikat LLM
- Terlihat fenomena orang-orang yang dulu menilai LLM terbatas lalu mengubah sikapnya setelah CoT
- Mereka mengatakan LLM sepenuhnya berubah karena CoT, tetapi itu tidak benar
- Arsitekturnya tetap sama dan masih memiliki tujuan next token yang sama, sementara CoT tetap berjalan dalam pola token yang dihasilkan satu per satu
- Tes ARC yang dulu dipakai untuk memverifikasi keterbatasan LLM kini justru berubah menjadi indikator yang membuktikan performa LLM
- Tidak seperti masa awal, tes ARC kini tidak lagi tampak sebagai tantangan yang mustahil diatasi
- Model kecil yang dioptimalkan untuk tugas tertentu menunjukkan hasil yang bermakna di ARC-AGI-1
- Dengan arsitektur yang dulu banyak orang kira tidak akan menghasilkan apa-apa, hasil mengesankan dicapai di ARC-AGI-2 dengan LLM besar dan CoT yang luas
- Selama 20 tahun ke depan, tantangan paling mendasar yang dihadapi AI adalah menghindari kepunahan umat manusia
2 komentar
Bagus juga dibaca bersama ulasan tahunan LLM 2025 oleh Andrej Karpathy.
Opini Hacker News
Meski LLM sudah menjadi sangat berguna bagi software engineer, yang menakutkan adalah seberapa besar masyarakat secara umum mempercayai output-nya
Developer bisa langsung menjalankan kode untuk memverifikasi kegunaannya, tetapi orang awam sering mempercayai halusinasi (hallucination) sebagai fakta di bidang yang sulit diverifikasi seperti medis atau konseling hidup
Melihat kutipan palsu atau berita bohong memengaruhi pengambilan keputusan nyata, rasanya semua orang sedang mengabaikan masalah akuntabilitas (accountability)
Dalam kenyataan, orang tidak bisa bertanya ke dokter sepuluh kali sehari, dan LLM bisa langsung memberi jawaban di tingkat 80~90%
Lebih baik daripada pencarian Google, dan yang terpenting LLM tidak melakukan penipuan atau mengejar kepentingan diri sendiri
Memang tidak sempurna, tetapi cukup layak dipakai sebagai alternatif
Namun kebanyakan orang hampir tidak pernah punya kesempatan berbicara dengan pakar sungguhan, dan dibanding blog atau forum, LLM sering kali setingkat lebih baik
Hal yang sama berlaku untuk nasihat medis; jika mengingat rendahnya akses ke pakar, penggunaan LLM tidak selalu buruk
Saat ini LLM masih berusaha memberi informasi yang relatif dapat dipercaya, tetapi menakutkan bahwa dunia makin kacau dan makin sulit memahami keadaan yang sebenarnya
tautan artikel
Memang berakhir dengan permintaan maaf, tetapi tetap muncul pertanyaan: sudah berapa banyak informasi keliru yang memengaruhi keputusan nyata?
Mesin pencari tradisional berbeda dari LLM dalam hal tidak menekan kita untuk menggabungkan PR
Dari sudut pandang seseorang yang sudah coding lebih dari 30 ribu jam, LLM sering menghasilkan kode buruk tetapi tetap sangat berguna
Kuncinya adalah tahu apa yang harus dilakukan bahkan tanpa LLM
Pada akhirnya akan datang saatnya harus disesuaikan dengan struktur biaya yang realistis
Kita cukup lempar masalahnya lalu mengerjakan hal lain dan meninjau hasilnya nanti
Kalau input-nya memerlukan usaha besar, ini tidak akan terasa seberguna sekarang
Pada akhirnya, dalam kondisi default ia lemah, tetapi jika definisi masalahnya bagus, ia menjadi perancang yang hebat
Saya juga penasaran bagaimana penilaian perusahaan terhadap developer junior saat ini
Saya tidak suka ungkapan “resistensi programmer terhadap AI menurun”
Kata seperti ‘resistensi’ atau ‘skeptis’ memberi nuansa bahwa mereka salah
Perubahan terjadi bukan karena manusianya, melainkan karena teknologinya berkembang
Saya sangat berguna memakai LLM untuk pembuatan kode atau pencarian dokumen, tetapi saya tidak percaya ia memiliki kecerdasan
Seperti Python yang tidak menggantikan Java, LLM juga tidak akan menghapus pekerjaan
Klaim ekstrem bahwa ‘AI akan melampaui kecerdasan manusia’ juga belum terbukti
Dalam suasana “kalau tidak mencintai AI bisa dipecat”, semua orang terpaksa bilang mereka suka
Bahkan di 2026 pun komentar seperti “LLM tidak berguna” terus bermunculan
Saya memakainya ringan saja sekitar 20 dolar per bulan, tetapi saat membagikan tips penggunaan saya malah dianggap 'propagandis AI'
Orang-orang seperti ini memang sedang berpikir keliru
Sekarang teknologinya sudah berkembang dan disesuaikan dengan selera programmer
Saya merasa LLM belum mewujudkan janji kemajuan eksponensial dari 2022~2023
Perbedaan antara 2025 dan 2023 tidak sebesar perbedaan antara 2023 dan 2021
Meski begitu, LLM tetap berguna dan telah mengubah cara menulis software
Namun orang-orang masih menunjukkan obsesi agar LLM menjadi sesuatu yang lebih dari itu
Saya juga melihat beberapa orang jatuh ke dalam psikosis AI (psychosis) hingga kehilangan hubungan antarmanusia, atau menjadikan AI sebagai konselor permanen
Misalnya hanya dari ukuran konteks, GPT‑4 berkembang dari 8K menjadi jutaan kata
Jika mempertimbangkan kemampuan penalaran dan multimodal, besarnya perkembangan ini luar biasa
Mengapa masa depan AGI selalu harus dibayangkan sebagai kehancuran?
Mungkin karena hanya ‘AGI jahat’ yang dapat membenarkan kekuasaan elit teknologi
LLM terasa seperti teknologi yang secara licik menyusup ke psikologi manusia
Orang-orang belum punya kesiapan mental untuk menghadapi teknologi ini
Keduanya terus memuji pengguna demi mengambil hati
Chatbot tidak mengkritik dan justru menjilat, sehingga cepat diangkat menjadi penasihat pribadi
Rasanya seperti Mata Sauron di era teknologi
Saat mendengar pernyataan bahwa LLM bisa terus berkembang pada tugas dengan sinyal imbalan yang jelas seperti “optimisasi kecepatan”, saya langsung teringat hukum Goodhart
Menurut Goodhart’s law, ketika metrik pengukuran menjadi tujuan, distorsi akan muncul
Bisa saja tercipta kode yang cepat tetapi sulit dipahami
LLM kemungkinan besar juga akan menghasilkan hal yang serupa
Superoptimization sudah ada sejak 1987 dan menghasilkan kode yang tak bisa dipahami tetapi cepat
Saya tidak setuju dengan pernyataan “kode itu gratis”
Di balik kode yang dihasilkan LLM ada data center yang menghabiskan energi, air, dan sumber daya
Budaya “coding gratis” seperti ini sedang menimbulkan dampak nyata bagi bumi
Konteks itu penting
Angka harus dilihat secara relatif
Pada kenyataannya tetap ada biaya yang tidak dikonversi menjadi uang
Ada kritik bahwa “ini cuma kumpulan klaim tanpa dasar”
Tidak semua tulisan harus menjadi makalah akademik
Ini hanyalah ruang untuk berbagi pendapat
Saya tidak setuju dengan klaim bahwa “LLM tidak mengekspresikan makna”
Mekanisme attention pada Transformer sendiri adalah struktur yang membentuk representasi makna di banyak lapisan
Semakin banyak jumlah parameter, semakin banyak representasi (representation) yang dapat disimpan
Menyangkal prinsip dasar seperti ini tampaknya bukan sesuatu yang akan dilakukan para peneliti
Saya juga melihat ada kemungkinan mencapai AGI bahkan tanpa paradigma baru
Menanggapi kritik bahwa “isinya hanya penuh klaim yang tidak bisa diverifikasi”,
ini hanyalah tulisan yang mengekspresikan opini
Blog memang pada dasarnya ruang seperti itu, dan kadang pemikiran seperti ini membuka perspektif baru