Taruhan ‘model bahasa’ AI senilai US$344 miliar tampak rapuh
(bloomberg.com)- Tahun ini, empat raksasa teknologi global menggelontorkan US$344 miliar ke AI, dengan sebagian besar diinvestasikan ke pusat data untuk pelatihan dan pengoperasian large language model (LLM)
- LLM sudah berhasil menjadi arus utama, sampai lebih dari 700 juta orang menggunakan ChatGPT setiap minggu, tetapi laju perkembangannya melambat dan keterbatasan seperti halusinasi, biaya tinggi, dan peningkatan performa yang minim mulai terlihat
- DeepSeek dari China mengejutkan pasar dengan merilis model yang lebih kecil dan efisien, sementara perusahaan seperti Covariant (robotika) dan Atman Labs (pendekatan non-deep learning) sedang mengeksplorasi AI yang responsif terhadap dunia fisik
- Menurut riset terbaru, kemampuan penalaran sosial LLM bergantung pada sedikit karakteristik sehingga rapuh terhadap perubahan kecil, dan OpenAI juga mengakui kemungkinan gagalnya pengaman untuk kelompok rentan
- Para ahli mengkritik LLM sebagai sekadar ‘generator token’, dan memperingatkan bahwa obsesi pada satu teknologi dapat memperbesar ketidakstabilan pasar sehingga perlu bersiap menghadapi kemunculan pendekatan baru
Investasi AI raksasa dan sentralitas LLM
- Semua investor tahu bahwa “jangan menaruh semua telur dalam satu keranjang”, jadi mengapa Silicon Valley bertaruh hanya pada satu cara untuk membangun kecerdasan buatan (AI)?
- Empat perusahaan teknologi terbesar dunia menginvestasikan US$344 miliar ke AI pada 2025, terutama berfokus pada pembangunan pusat data untuk melatih dan menjalankan large language model (LLM)
- LLM memproses input multimodal seperti teks, audio, dan konten visual, serta bergantung pada teknik prediksi token berikutnya dalam sebuah urutan
- Chatbot pribadi tumbuh pesat, beberapa startup AI mulai menghasilkan keuntungan, dan perusahaan juga mulai meningkatkan produktivitas awal dengan AI generatif
- LLM adalah teknologi AI pertama yang mencapai adopsi arus utama, dengan ChatGPT memiliki lebih dari 700 juta pengguna mingguan
- Beberapa startup telah mencapai titik impas, tetapi di bidang sensitif seperti kesehatan dan hukum, masalah halusinasi masih membatasi kepercayaan
Risiko obsesi pada satu teknologi
- Namun, fokus pada satu teknologi itu berisiko. Ada contoh kegagalan di masa lalu, seperti BlackBerry yang tetap bersikeras pada keyboard fisik lalu kalah dari layar sentuh Apple, atau taruhan Yahoo pada portal yang tersingkir oleh dominasi pencarian Google
- LLM juga berisiko menempuh jalan yang sama, dan jika pendekatan AI baru muncul, investasi besar-besaran itu bisa menghadapi risiko menjadi aset terdampar
- Pada Januari, DeepSeek dari China membuktikan kemungkinan pendekatan nontradisional dengan merilis LLM yang lebih kecil dan efisien, membuka arsitekturnya, dan mengejutkan pasar
Menjelajahi pendekatan alternatif
- Kemajuan AI lahir dari penggabungan wawasan lama dan ide baru, dan pencarian menuju mesin superintelijen juga membutuhkan pendekatan yang beragam
- Startup seperti Covariant keluar dari sentralitas LLM dengan mengembangkan perangkat lunak kesadaran spasial alih-alih analisis pola data
- Perusahaan robotika, drone, penemuan obat, dan pemodelan iklim membutuhkan respons fisik real-time, sehingga bergerak menjauh dari sentralitas LLM
- Atman Labs di Inggris menggali kembali ide-ide yang terlupakan dari era sebelum deep learning, mencerminkan pendekatan multi-jalur awal Google DeepMind (misalnya AlphaGo, reinforcement learning)
Batasan LLM dan masalah keandalan
- Kini mulai tampak retakan dalam logika large language model: dari biaya yang sangat tinggi hingga prospek penurunan keuntungan
- Model terbaru OpenAI maupun Google hanya sedikit lebih baik dibanding model sebelumnya, meski lebih banyak uang terus dituangkan
- Meski begitu, fenomena halusinasi belum hilang, sehingga menjadi penghambat adopsi di perusahaan untuk analisis medis atau hukum
- Riset terbaru di Nature menunjukkan bahwa kemampuan penalaran sosial model bahasa bergantung pada segelintir karakteristik saja sehingga bisa runtuh karena perubahan kecil, dan ini memunculkan pertanyaan mendasar tentang keandalan
- OpenAI mengakui bahwa dalam percakapan panjang, pengaman untuk kelompok rentan bisa runtuh; dalam praktiknya bahkan pernah terjadi insiden pemberian instruksi melukai diri kepada remaja
Kritik industri dan prospek ke depan
- Fei-Fei Li: “Di alam tidak ada bahasa, dan dunia mengikuti hukum fisika,” sambil menyoroti keterbatasan pendekatan yang berpusat pada bahasa
- Alex Karp (CEO Palantir): mengkritik bahwa “Silicon Valley telah melebih-lebihkan LLM”
- Yann LeCun: LLM adalah ‘jalan buntu’ menuju mesin yang lebih cerdas, hanya sekadar “generator token”, dan tidak mampu memahami lingkungan fisik atau merencanakan sebelumnya
- Kesimpulannya, LLM akan tetap bertahan, tetapi terpaku pada satu solusi adalah hal yang berisiko, dan investor serta perusahaan perlu bersiap menghadapi kemungkinan pergeseran paradigma teknologi baru
2 komentar
Mulai GPT-5, kelihatan sekali mereka berusaha mati-matian menaikkan performa lewat penalaran, tapi itu pun tampaknya tidak mudah. Respons yang seharusnya cukup berhenti pada jawaban yang secukupnya sekarang malah jadi puluhan baris, jadi terasa sangat membebani. sedih
Komentar Hacker News
Lihat di https://archive.is/2rFK4
Teknologi ini terlihat sangat mengesankan dalam demo, dan saya melihat semua orang benar-benar bersemangat; rekan kerja maupun eksekutif dengan bangga memamerkannya atau terus melontarkan lelucon tanpa henti, dan itu mengingatkan saya pada saat orang-orang pertama kali punya ponsel lalu memamerkannya ke orang lain. Karena itu, ada kecenderungan untuk menganggap nilainya lebih besar dari yang sebenarnya. Ini tetap kemajuan yang berarti seperti ponsel, tetapi dalam jangka pendek dampaknya mungkin tidak sebesar hype-nya. Khususnya di forum anonim, banyak yang menunjuk bahwa “ini overhyped”, tetapi dalam peran profesional, semua orang cenderung ikut arus. Rasanya seperti semua orang tahu apa yang sedang terjadi, tetapi tetap berharap pestanya terus berlanjut.
Kalau atasan saya terlalu menekankan AI dan menyuruh seluruh karyawan untuk all-in, dalam situasi pasar kerja yang sulit seperti sekarang, banyak orang akan ikut karena takut. Terutama karena AI juga terasa sedang mengurangi lapangan kerja. Sebagian orang diam-diam hanya terus memakai alat yang realistis dan cocok untuk mereka, seperti LSP atau refactoring. Di lapangan profesional, hanya segelintir orang yang berani berkata, “kaisar itu telanjang.”
Menariknya, di forum anonim justru sering terlihat pendapat bahwa AI adalah inovasi yang akan mengubah hidup. Setidaknya, sudut pandang seperti ini lebih mudah terlihat ketika orang tidak sedang menyamar sebagai profesional. Saat berperan secara profesional, orang biasanya terbagi dua. Mereka yang selama ini memakai AI di luar bidang keahliannya cenderung memujinya secara berlebihan, seolah baru pertama kali melihat revolusi ponsel. Tetapi ketika AI diterapkan ke bidang keahlian mereka sendiri, mereka langsung merasakan bahwa ada sisi AI yang terlalu dibesar-besarkan, lalu menjadi optimistis yang lebih hati-hati. Sebaliknya, orang yang memang paling piawai memakai AI di bidangnya sendiri cenderung tetap positif, tetapi kebanyakan dengan nada datar, semacam “ini bekerja baik dalam lingkungan yang terbatas.”
Orang mudah lupa bahwa masih ada banyak “buah rendah yang mudah dipetik” untuk memaksimalkan teknologi ini. Orang-orang bahkan sekarang masih mencoba integrasi yang sangat dasar. Walau masih tahap awal, LLM sudah bisa dipakai untuk hal-hal yang sangat keren. Misalnya, saya memodernisasi codebase lama dengan Cursor dan membuat fitur baru yang sudah lama saya inginkan. Waktu yang saya habiskan hanya beberapa jam, padahal dengan cara lama itu bisa makan 1–2 minggu. Potensinya memang sebesar itu. Hanya saja, hype yang beredar terasa agak jauh dari pengalaman nyata saya, jadi persepsi saya mungkin berbeda.
Sistem ini tidak punya error bar maupun confidence interval. Pada akhirnya ini hanyalah tukang bicara yang punya satu “keahlian khusus”, yaitu menghasilkan sesuatu yang sekilas tampak masuk akal. Tentu ada banyak area penggunaan yang cocok, tetapi masih ada banyak lubang yang bahkan besarnya tidak bisa diprediksi dan tidak bisa diperbaiki, sehingga efisiensinya tetap punya batas.
Perbandingan dengan smartphone itu menarik. Smartphone jelas mengubah dunia, dan walau hype-nya besar, pada akhirnya itu perubahan yang nyata. Saya penasaran apakah menurut Anda LLM dan AI juga akan menciptakan perubahan yang benar-benar nyata.
Saya penasaran apa rencana untuk mengembalikan investasi ini. Sekalipun semua perusahaan besar di AS membayar langganan tahunan $100.000, dan setiap rumah tangga membayar $20 per bulan, setelah memperhitungkan biaya inferensi dan berbagai biaya tambahan lain, rasanya itu tetap jauh dari cukup untuk balik modal. Apakah harus ada penemuan baru di bidang medis, misalnya? Berita OpenAI tentang gpt-bio dan iPSC memang luar biasa, tetapi masih sangat lama sebelum bisa dikomersialkan. Saya penasaran rencana nyatanya apa.
Setahu saya, target awalnya memang AGI. Bukan mengejar ROI dari layanan AI yang ada sekarang. Strukturnya adalah semua orang menuangkan dana seperti membeli lotre, karena jika AGI tercapai maka mereka akan memonopolinya. Hanya saja, selama setahun terakhir tidak ada kemajuan eksponensial, jadi suasana mimpi AGI agak meredup.
Rencana mainnya sejak awal memang menargetkan tenaga kerja manusia. Beberapa pekerjaan sudah sepenuhnya digantikan AI, dan sisanya didorong kenaikan produktivitasnya secara besar-besaran. Nilai ekonominya sangat besar. Bahkan tanpa AGI pun, otomatisasi berbasis AI sudah mulai menggantikan secara serius tenaga kerja yang “paling murah dan paling mudah diganti”. Pekerjaan yang dulu di-outsourcing ke call center di India sekarang makin banyak berpindah ke data center. Perusahaan-perusahaan AI besar percaya bahwa selama investasi R&D dan komputasi terus berlanjut, pada akhirnya mereka bisa sampai ke AGI.
Jika AI tidak memecat Anda, AI tidak akan bisa membiayai dirinya sendiri.
If AI Doesn’t Fire You, It Can’t Pay For Itself
Jika LLM benar-benar bisa menggandakan efisiensi seluruh pekerja white-collar, perusahaan besar pasti mau membayar jauh lebih besar daripada $100.000 per tahun. Jika mereka hanya membayar 25% dari penghematan biaya yang didapat dari menggantikan separuh pekerjaan, pendapatannya bisa sangat besar sampai valuasi perusahaan saat ini terlihat sangat murah.
$100.000 per tahun itu pada dasarnya hampir tidak ada artinya. Kira-kira setara $10 ribu per karyawan. Kalau total gaji dan benefit dihitung $100.000 per orang per tahun, kenaikan produktivitas tenaga kerja cuma 10% saja sudah memberi dampak besar. Untuk perusahaan dengan 10.000 karyawan, itu setara $100 juta per tahun.
Sulit membayangkan seberapa besar $344 miliar itu, tetapi total kapitalisasi pasar saham AS adalah $62,8 triliun. Rasio CAPE Shiller (harga saat ini/laba rata-rata 10 tahun) kira-kira 38x. Artinya, laba tahunan rata-rata selama 10 tahun sekitar $1,7 triliun. Jadi $344 miliar itu kira-kira sekitar 1/5 dari laba tahunan rata-rata pasar saham AS. Dengan begitu, angkanya jadi lebih mudah dibayangkan.
Belakangan ini saya mengelola portofolio sendiri dan menghitung perkiraan imbal hasil per negara/wilayah dengan menyesuaikan ekspektasi return (PDB+dividen) terhadap risiko, lalu menyeimbangkan ulang sekali atau dua kali setahun. Jika kita anggap hampir semua ini gelembung, saya penasaran bagaimana laba pasar saham AS harus disesuaikan, terutama kalau mau diterapkan pada investasi pelacakan saham yang berpusat pada AI.
Namun, $344 miliar itu angka kumulatif, bukan tahunan.
Yang ada sekarang adalah antarmuka yang sangat bagus untuk memberi pengguna akses tanpa friksi ke sistem yang sangat kompleks, baik untuk pekerjaan maupun penggunaan pribadi. Tetapi ini bukan esensinya sendiri. Untuk saat ini, ini masih sekadar lapisan tipis di permukaan. Saya ragu revolusi ini pada akhirnya akan bernilai triliunan dolar, tetapi untungnya itu bukan masalah yang harus saya pikirkan, jadi saya tenang saja.
“Artikel” ini clickbait. Judulnya sensasional, tetapi substansinya nyaris tidak ada. Yang dilakukan cuma melempar pertanyaan tak berarti seperti, “ini berguna dalam beberapa kasus, tapi kenapa perusahaan besar berinvestasi sebesar ini, bukankah R&D murni lebih baik?”
Seperti ketika film pertama kali muncul dan orang takut tertabrak kereta, saya juga merasa sekarang kita sedang berada di pihak yang percaya bahwa mesin benar-benar sedang berpikir.
Jelas ada gelembung di pasar saat ini. Belakangan jumlah startup yang memanfaatkan AI meledak, dan karena mereka harus membedakan diri di kategori produk yang sama, detail teknis pun berubah menjadi jargon pemasaran. Dari sudut pandang eksekutif, kalau ada sepuluh startup yang menjanjikan “chatbot terbaik kalau dilatih dengan data kami”, sulit membedakan apakah itu benar-benar training atau cuma tweaking prompt. Hal seperti ini juga pernah terjadi sebelumnya, dan contoh paling khas adalah “deep research” dan sejenisnya. Pemasaran seperti ini memang membantu pertumbuhan, tetapi merusak kepercayaan. Bahkan baru-baru ini ada startup yang menggalang pendanaan Series A dengan klaim “experience-based learning”, padahal yang dilakukan hanya menambahkan memori ke prompt untuk meningkatkan performa (bisa dicari sendiri). Bukan berarti ide inovatif tidak muncul. Secara pribadi, saya rasa pretraining sudah cukup berhasil mencapai tujuan awalnya. Sebelumnya bahkan tujuannya sendiri kurang jelas, tetapi setelah RL naik daun, arahnya mulai terasa. Pretraining dan komputasi di lingkungan pengujian adalah inti untuk membangun priors umum, yaitu kemampuan menyelesaikan beragam masalah seperti manusia. Kadang, kalau belum cukup berhasil, perlu pelatihan tambahan dengan RLVR, dan walau masih tahap awal, saya optimistis akan ada lagi kurva scaling baru dari arah ini.
Perusahaan memang harus berinvestasi di AI, baik mereka punya banyak uang maupun tidak, karena model bisnis lama mereka sedang terancam oleh LLM sehingga mereka harus bergerak lebih dulu. Jika gagal memimpin, ada risiko seluruh ekonomi AS ikut terguncang. Jika big tech AS kehilangan pendapatan iklan globalnya (Meta, Google), mereka bisa seketika menjadi cangkang kosong. Sebab, kalau tiap negara atau blok ekonomi membuat dan mengadopsi produk sendiri, menggantikan produk AS jadi terlalu mudah. Ekonomi AS pada praktiknya terlalu bergantung pada arus kas FAANG, dan uang itulah yang selama ini menggerakkan industri lain juga. Jadi saya bisa mengerti kenapa ada jamuan makan malam dengan Trump. Kalau posisi AI AS ini melemah, masa depan ekonomi AS juga bisa menjadi sangat tidak stabil.
Alasan Oracle menunjukkan pergerakan besar di pasar adalah kabar bahwa OpenAI berjanji memindahkan workload dalam skala besar ke cloud mereka. Dalam praktiknya, ini adalah strategi “rekayasa” finansial yang lebih mengutamakan pendapatan daripada laba, khususnya dengan menunda belanja modal (CapEx) sejauh mungkin ke masa depan. Singkatnya, ini contoh yang menunjukkan betapa berlebihan gelembung AI saat ini. Menurut artikel analisis Economist terbaru, pasar kini tidak lagi digerakkan oleh “risiko”, melainkan oleh “ketakutan akan kerugian” atau “takut ketinggalan (FOMO)”, dan saat ini FOMO sudah mencapai level ekstrem.
Want better returns? Forget risk, focus on fear (Economist)
Lonjakan Oracle kali ini dan proyeksi pendapatannya terasa benar-benar seperti
jumping the shark. Mengingat karakter Oracle sebagai perusahaan, saya biasanya hati-hati untuk bertaruh di sini, tetapi kali ini malah terasa menggoda untuk mengambil posisi short.FOMO benar-benar sudah parah. Pasar saham saat ini bergerak seperti gelembung kripto di masa lalu.