Apakah Segalanya Mengarah pada Kebohongan

(aphyr.com)

2 poin oleh GN⁺ 2026-04-09 | 1 komentar | Bagikan ke WhatsApp

Teknologi yang kini disebut AI sebenarnya adalah sistem machine learning (ML) yang kompleks, dengan struktur yang secara statistik melengkapi teks, gambar, dan audio
LLM adalah mesin yang menciptakan ‘kebohongan yang terdengar meyakinkan’ layaknya teater improvisasi, menghindari jawaban bahwa ia tidak tahu dan menghasilkan fakta-fakta fiktif
Orang kerap salah mengiranya sebagai entitas yang sadar, tetapi penjelasan diri dan proses penalaran model hanyalah narasi fiktif
LLM menunjukkan kinerja yang tidak merata, mampu memecahkan masalah tingkat tinggi tetapi gagal pada tugas sederhana, sehingga memperlihatkan batas yang tidak dapat diandalkan
Di tengah ketimpangan dan ketidakpastian ini, ML sedang menjadi teknologi yang secara mendasar mengubah masyarakat manusia menjadi sesuatu yang ganjil

Kata pengantar

Generasi yang tumbuh dengan mengagumi dunia fiksi ilmiah Asimov dan Clarke pernah membayangkan kemunculan mesin cerdas secara optimistis, namun mengalami kekecewaan dalam kenyataan ketika uji Turing runtuh
Ketika sebuah perusahaan cloud besar pada 2019 mengumumkan perangkat keras untuk melatih LLM, muncul kekhawatiran bahwa penyebaran deep learning dapat melahirkan bentuk baru spam dan propaganda
Tulisan ini menjelajahi ruang negatif dalam wacana AI, dan disusun sebagai upaya menampakkan kontur risiko dan kemungkinan, bukan analisis yang sepenuhnya lengkap
Karena istilah “AI” terlalu luas, pembahasan difokuskan pada diskusi yang lebih konkret tentang ML dan LLM
Sebagian prediksi sudah menjadi kenyataan, sementara sebagian lain masih berada di wilayah yang tidak pasti dan ganjil

Apa itu “AI”

Yang saat ini disebut “AI” adalah kelompok teknologi machine learning (ML) yang kompleks, yaitu sistem yang mengenali, mengubah, dan menghasilkan vektor token seperti teks, gambar, audio, dan video
LLM (Large Language Model) menangani bahasa alami, dan bekerja dengan memprediksi kelanjutan yang secara statistik mungkin dari string masukan
Model dilatih dengan halaman web dan korpus data berskala besar seperti buku dan musik bajakan, lalu setelah pelatihan dapat digunakan berulang kali melalui inferensi (inference) berbiaya rendah
Model tidak belajar sendiri seiring waktu, dan hanya diperbarui melalui penyesuaian operator atau pelatihan ulang
“Ingatan” model percakapan sebenarnya diwujudkan sebagai teknik struktural yang memasukkan ringkasan percakapan sebelumnya ke dalam masukan

Fanfiction realitas

LLM bekerja seperti mesin improvisasi (improv), memperlihatkan pola ‘yes-and’ yang meneruskan konteks masukan dengan “lalu kemudian...”
Karena itu, ia menghasilkan kalimat yang terdengar meyakinkan tetapi tidak terkait fakta, salah memahami satire atau konteks, dan menciptakan informasi palsu
Manusia mudah salah mengira keluaran semacam ini sebagai ujaran dari makhluk yang benar-benar sadar
Karena LLM menghasilkan keluaran untuk semua masukan, ada kecenderungan untuk menghindari jawaban “tidak tahu” dan justru mengarang kebohongan
Kebohongan ini bukan tindakan yang disengaja, melainkan muncul sebagai produk sosioteknis dari interaksi antara manusia dan mesin

Narator yang tidak dapat dipercaya

Orang-orang meminta penjelasan diri dari LLM, seperti “mengapa kamu melakukan itu”, tetapi model tidak memiliki kemampuan kesadaran diri
LLM hanya menghasilkan kelengkapan probabilistik berbasis percakapan sebelumnya dan korpus, dan penjelasan tentang dirinya pun disusun sebagai kisah fiktif
Model “reasoning” juga bekerja dalam bentuk mengemas proses berpikirnya sebagai narasi
Menurut penelitian Anthropic, sebagian besar catatan penalaran Claude tidak akurat, dan bahkan pesan status seperti “sedang berpikir” hanyalah pengarahan fiktif

Model itu pintar

Dalam beberapa bulan terakhir, persepsi bahwa kemampuan LLM meningkat pesat makin meluas
Beberapa engineer melaporkan bahwa Claude atau Codex dapat langsung menyelesaikan tugas pemrograman yang kompleks
Di berbagai bidang, sudah ada pemanfaatan nyata seperti perancangan diet, peninjauan spesifikasi konstruksi, visualisasi 3D, dan penulisan evaluasi diri
Ia juga menunjukkan kinerja tinggi pada prediksi pelipatan protein oleh AlphaFold dan pembacaan citra medis
Dalam gaya penulisan bahasa Inggris, gambar, dan musik, semakin sulit membedakan manusia dan mesin, meskipun pembuatan video masih terbatas

Model itu bodoh

Pada saat yang sama, LLM juga dinilai sebagai sistem ‘bodoh’ yang terus mengulang kesalahan dasar
Sebagai contoh, Gemini berulang kali salah menangani geometri dan material dalam rendering model 3D, dan Claude menghasilkan kode visualisasi JavaScript yang tidak bermakna
ChatGPT bahkan gagal memenuhi permintaan sederhana untuk mengubah warna, dan melontarkan klaim palsu yang salah mengasumsikan orientasi seksual pengguna
Dilaporkan pula kasus ketika LLM membuat grafik dari data palsu, gagal mengendalikan smart home, atau menyebabkan kerugian finansial
Fitur ringkasan AI Google menunjukkan tingkat kesalahan sekitar 10%, dan klaim tentang “kecerdasan setingkat ahli” dinilai sebagai fantasi yang dibesar-besarkan

Batas yang bergerigi

Manusia umumnya dapat memperkirakan rentang kemampuannya, tetapi kinerja sistem ML tidak teratur dan sulit diprediksi
LLM dapat menyelesaikan matematika tingkat tinggi tetapi gagal pada masalah bahasa yang sederhana, serta memberikan penjelasan yang tidak memiliki akal sehat fisik
Ketimpangan ini disebut ‘jagged technology frontier’, dan berbeda dari distribusi kemampuan manusia karena berbentuk tak kontinu
Karena ML bergantung pada data pelatihan atau jendela konteks (window), ia rapuh terhadap tugas yang memerlukan pengetahuan implisit
Robot humanoid atau ranah yang menuntut embodied knowledge masih jauh dari tercapai

Apakah sedang membaik, atau tidak

Para peneliti bahkan belum memahami dengan jelas penyebab keberhasilan model transformer
Sejak makalah 2017 Attention is All You Need, berbagai arsitektur telah dicoba, tetapi pendekatan sekadar menambah parameter masih tetap yang paling efektif
Meski biaya pelatihan dan jumlah parameter melonjak tajam, peningkatan kinerja melambat, dan belum jelas apakah ini ilusi atau batas nyata
Bahkan jika ML tidak lagi membaik, ia sudah memberi dampak besar pada masyarakat, politik, seni, dan ekonomi
Pada akhirnya, ML adalah teknologi yang secara mendasar mengubah kehidupan manusia menjadi sesuatu yang ganjil, dan perkembangan berikutnya kemungkinan akan “bergerak ke arah yang aneh”

Catatan istilah

Karena “AI” terlalu luas, istilah ini diperjelas menjadi ML atau LLM
“AI generatif” dianggap ungkapan yang tidak lengkap karena tidak mencakup tugas pengenalan
Alasan LLM tampak berbohong tentang dirinya sendiri adalah karena pengaruh narasi manusia tentang AI dan data pelatihan
Sebagai sanggahan terhadap klaim “model itu bodoh”, ada pendapat bahwa masalahnya terletak pada prompt atau pemilihan model, tetapi telah dipastikan bahwa kesalahan yang sama berulang bahkan pada model komersial terbaru

1 komentar

GN⁺ 2026-04-09

Komentar Hacker News

Akhir-akhir ini saya sering merasa situasi sekarang mirip dengan masa Revolusi Industri
Sebelum Revolusi Industri, sumber daya alam dianggap hampir tak terbatas, dan karena efisiensi masih rendah, manusia tidak mampu benar-benar menghabiskannya. Namun dengan munculnya mesin, segelintir orang menjadi mampu menguras sebagian bumi sepenuhnya, dan akibatnya hak kepemilikan dan sistem hukum pun menjadi diperlukan
Sekarang kita berada di era revolusi informasi, dan AI memainkan peran yang sama di ranah digital. Sebuah perusahaan melatih AI dengan mendaur ulang karya para kreator dalam skala industri. Akibatnya, keseimbangan antara kreator dan konsumen mulai runtuh
Di dunia tempat tulisan seorang penulis diserap ke dalam ChatGPT lalu teks aslinya dilupakan, timbul pertanyaan: siapa yang akan terus membuat konten? Rasanya kita sedang memasuki masa sulit seperti London pada era Dickens, sampai masyarakat dan hukum berhasil mengejar keadaan
- Pernyataan bahwa “alam itu tak terbatas” sebenarnya tidak benar. Sejak awal Zaman Besi sudah ada masalah deforestasi, dan ketegangan antara pertanian, penggembalaan, dan pengelolaan hutan telah berlangsung selama ribuan tahun
- Banyak orang memikirkan hal serupa. Paus saat ini, Leo XIV, memilih namanya dengan meneladani Paus Leo XIII pada masa Revolusi Industri, dan sambil mengutip ensiklik Rerum novarum ia menyinggung tanggung jawab sosial di era AI. Artikel terkait: Vatican News
- Saya menulis bukan semata-mata karena uang. Alasannya adalah dorongan untuk mencipta dan keinginan untuk sedikit saja mengubah dunia. Jika ChatGPT mempelajari tulisan saya lalu itu membantu seseorang, itu sendiri sudah bermakna. Tidak semua orang harus setuju dengan saya, tetapi saya memandangnya secara positif
- Saya justru melihatnya dari arah sebaliknya. Kini kreativitas telah menjadi barang publik digital yang bisa dilakukan siapa saja. Karena AI telah mengotomatisasi kreasi, tidak ada alasan bagi kreator tertentu untuk memonopolinya. Open source pada akhirnya akan menggantikan perusahaan AI, dan jika tidak, maka itu seharusnya dinasionalisasi sebagai utilitas publik. Konsep kepemilikan digital pada dasarnya ditakdirkan hilang karena sifat teknologi itu sendiri
- Bahkan sebelum Revolusi Industri pun orang sudah bertikai soal hak atas air dan penggunaan sungai. Misalnya Perang Umma–Lagash adalah contoh sengketa air dari 4000 tahun lalu
Sejak “Attention is All You Need”, perkembangan bukan sekadar memperbesar parameter, tetapi bergerak ke arsitektur yang lebih rumit seperti Mixture-of-Experts, Sparse Attention, dan Mamba/Gated Linear Attention. Tafsir atas Bitter Lesson yang menyederhanakan semuanya menjadi “cukup tambah komputasi” adalah kesalahpahaman
- Penulis sejak awal sudah menyatakan, “Saya bukan pakar ML,” dan tulisan ini adalah esai yang mengumpulkan pemikiran selama 10 tahun terakhir. Ungkapan “mungkin ini variasi dari Bitter Lesson” sekadar dimaksudkan sebagai bahan renungan. Tujuan tulisan ini lebih pada memicu pemikiran daripada ketepatan teknis
- Saya juga beralih dari Qwen 3 ke Qwen 3.5, dan walaupun parameternya berkurang, performanya jauh lebih baik. Berkat inovasi algoritmik seperti Gated DeltaNet dan TurboQuant, efisiensi memori meningkat dan panjang konteks juga bertambah. Pada akhirnya, yang penting adalah inovasi struktural
- Setelah GPT-3(175B), GPT-4 diperkirakan memiliki 1,8 triliun parameter. Jadi pernyataan bahwa “peningkatan parameter berhenti sejak 5 tahun lalu” itu salah
- Saya penasaran apakah Mamba benar-benar dipakai pada model skala besar. Setahu saya implementasi yang efisien masih kurang. Saya juga ingin tahu apa tepatnya yang dimaksud dengan “pelatihan menjadi jauh lebih canggih”
- Transformer bukan sihir. Ia hanya jauh lebih efisien dibanding LSTM, RNN, CNN. Belakangan ini bahkan muncul model yang memakai reasoning token untuk mengeluarkan proses berpikirnya. Memang belum sempurna, tetapi sejauh ini itulah pendekatan yang bekerja paling baik
Model-model saat ini pada dasarnya sudah mempelajari hampir semua data publik. Jika pembatasan hak cipta makin ketat, bisa muncul masalah kekurangan data pelatihan. Tanpa inovasi baru setingkat “Attention is All You Need”, rasanya kita mendekati batas peningkatan performa
- Meski begitu, para peneliti terus mencoba ide-ide baru. Mungkin saja akan ada terobosan dalam 5–10 tahun ke depan. Hanya saja, biaya yang harus ditanggung sampai saat itu akan besar
- Bidang matematika atau perangkat lunak relatif kurang dibatasi karena memungkinkan pembuatan data sintetis. Itu adalah ranah tempat pembelajaran dengan verifikasi diri seperti AlphaGo Zero dimungkinkan
- Sebenarnya perkembangan saat ini pun dimulai dari eksperimen “bagaimana kalau datanya kita perbanyak secara besar-besaran”. Setelah itu, diferensiasi mulai terjadi pada tahap post-training
- Beberapa perusahaan mempekerjakan orang untuk membuat token berkualitas tinggi, lalu memakai itu sebagai dasar untuk menghasilkan data sintetis dan menggunakannya lagi untuk pelatihan
Pernyataan bahwa “LLM masih belum kreatif” terlalu menyederhanakan keadaan. Pada persoalan berbasis teks, ia sudah mampu melakukan penalaran logis, dan di ranah gambar maupun UI perkembangannya juga sangat cepat
- Intinya adalah LLM tidak ‘memahami’ gagasan. Penalaran hanyalah loop umpan balik sederhana, bukan pemikiran yang sesungguhnya. Mengenai apakah keterbatasan ini bisa diatasi secara teknis, optimisme dan pesimisme sama-sama ada
- Bagi saya, LLM kadang memang memberi ide yang belum pernah saya lihat sebelumnya. Namun saya tidak yakin apakah itu benar-benar baru menurut standar seluruh umat manusia
- Tulisan ini bukan berargumen bahwa “LLM itu bodoh”, melainkan bahwa batas antara kecerdasan dan kebodohan itu rumit dan tak terduga
- Walaupun LLM bisa memecahkan soal logika, mendekatinya dengan cara yang tidak ada di data pelatihan tetap masih sulit
- Pembuatan gambar juga berkembang cepat. Misalnya bisa dilihat pada proyek GenAI Showdown
Saya sering menjelaskan kepada orang-orang bahwa di dalam LLM tidak ada kesadaran atau otonomi. Kata ‘AI’ saat ini dipakai dengan makna yang terlalu berlebihan
- Kalau begitu, saya jadi penasaran seperti apa perubahan struktur internal yang dibutuhkan agar sesuatu bisa memiliki ‘kesadaran’ atau ‘otonomi’
- Sebenarnya ‘AI’ adalah istilah akademik yang sudah ada sejak 1950-an. Awalnya itu merujuk pada upaya meniru cara berpikir manusia, tetapi sekarang artinya lebih sekadar sistem komputasi cerdas. Masyarakat masih memahaminya dalam arti yang manusiawi, sehingga timbul kebingungan
- Saya justru menganggap istilah ‘AI’ itu akurat. Mesin hanya menjalankan kecerdasan secara artifisial. Seperti matematika atau logika, pada akhirnya ini adalah proses mekanis. Sebagaimana transistor menjalankan logika, prediksi token juga merupakan hal yang wajar
- Saya juga bertanya-tanya apakah ada dasar yang kuat untuk yakin bahwa otak manusia bekerja dengan cara yang pada dasarnya berbeda dari LLM
Saya tertawa melihat contoh LLM salah menyelesaikan soal fisika. Sebenarnya, para fisikawan pun sering memulai dari asumsi yang tidak realistis. Sampai ada lelucon seperti “atap bola tanpa gesekan”
- Ini adalah pendekatan khas sains. Mula-mula kita mencari pendekatan melalui model sederhana, lalu menambahkan kenyataan yang rumit di atasnya
Rasanya masih sulit mengatakan bahwa sistem saat ini sudah lulus uji Turing. Semakin panjang percakapan, konteksnya makin runtuh, dan ada batasan untuk mensimulasikan sifat manusia seperti neuroplastisitas
- Dulu sempat terlihat seolah sudah lolos, tetapi sekarang kebanyakan orang bisa membedakan gaya bicara khas LLM. Hanya saja, model memang sengaja dirancang agar lebih ramah dan bertele-tele, jadi perbandingan yang sepenuhnya adil memang sulit
- Uji Turing sejak awal memang bukan ujian lulus/gagal
- Akhir-akhir ini tersebar anggapan bahwa “LLM telah menaklukkan uji Turing”, tetapi kenyataannya, jika mempertimbangkan syarat bahwa penguji mengetahui teknologi terkini, tetap masih mudah dibedakan
- Namun jika tesnya seketat itu, manusia pun bisa gagal karena kurang fokus
- Dari semua LLM yang pernah saya lihat, tidak ada satu pun yang benar-benar pandai menulis. Saya penasaran apakah suatu hari akan muncul model yang benar-benar menyenangkan untuk diajak bercakap-cakap
Judul artikel asli, “The Future of Everything is Lies, I Guess”, sudah diubah karena tidak sesuai dengan isi. Sebenarnya ini tulisan yang seimbang, dan judul bergaya umpan klik itu diganti sesuai pedoman HN
- Itu keputusan yang tepat. “Kebohongan” yang dimaksud dalam tulisan ini bukan hallucination, melainkan fenomena ketika model ditanya “mengapa kamu menjawab begitu?” lalu ia mengarang alasan yang tidak relevan. Manusia juga kadang membuat kesalahan serupa
- Menurut saya, berkat kurasi itu judulnya jauh lebih baik
- Judul aslinya memang bagus untuk menarik klik, tetapi kurang mewakili isi
Pembahasan tentang kesadaran seharusnya dilakukan dengan lebih rendah hati. Kesadaran manusia saja belum terdefinisi, jadi kita tidak bisa dengan pasti menyimpulkan soal kesadaran LLM
- Beberapa teori kesadaran mengecualikan LLM, tetapi ada juga yang membuka kemungkinan. Ini adalah wilayah tanpa jawaban pasti
- Sebagian orang memuja LLM seperti berhala silikon. Mereka percaya sepenuhnya memahami makhluk yang mereka ciptakan, tetapi pada saat yang sama juga menganggap ada hakikat kecerdasan yang misterius di dalamnya. Sikap ini mirip dengan upaya para alkemis di masa lalu yang ingin menciptakan emas
Pada bagian akhir tulisan disebutkan bahwa “AI akan mengubah seluruh masyarakat”, tetapi edisi kali ini terasa lebih berfokus pada keterbatasan LLM daripada itu
- Sebenarnya tulisan ini adalah pengantar untuk seri 10 bagian. Pada bagian-bagian berikutnya akan dibahas berbagai topik seperti politik, seni, ekonomi, dan hubungan antarmanusia
- Justru sekarang adalah saat untuk terus menekankan pesan bahwa “LLM tidak sempurna”. Karena dunia sedang keliru menganggap AI sebagai solusi serba bisa.

Apakah Segalanya Mengarah pada Kebohongan

Kata pengantar

Apa itu “AI”

Fanfiction realitas

Narator yang tidak dapat dipercaya

Model itu pintar

Model itu bodoh

Batas yang bergerigi

Apakah sedang membaik, atau tidak

Catatan istilah

Bacaan terkait

1 komentar

Komentar Hacker News