- AI Index 2026 adalah laporan yang merangkum tren AI secara keseluruhan lewat indikator seperti performa benchmark, investasi, persepsi publik, komputasi, dan emisi karbon
- Peluncuran model AI yang menonjol terus didominasi Amerika Serikat dan industri, sementara Tiongkok mencatat keunggulan yang jelas dalam pemasangan robot industri
- Kapasitas komputasi AI global telah meningkat lebih dari 3 kali lipat setiap tahun sejak 2022, dan GPU Nvidia kini mencakup lebih dari 60 persen dari total kapasitas
- Performa benchmark LLM multimodal dan agentic AI meningkat cepat, tetapi untuk tugas umum seperti membaca jam analog, akurasinya tetap rendah
- Investasi AI pada 2025 mencetak rekor tertinggi dengan melampaui 581 miliar dolar AS, sementara dampak ketenagakerjaan, kepercayaan pada regulasi, dan penerimaan publik menunjukkan perbedaan besar antarnegara dan antarindikator
- Laporan AI Index 2026 Stanford yang panjangnya lebih dari 400 halaman merangkum kondisi AI dari berbagai sudut seperti skor benchmark, investasi, dan persepsi publik
- Performa model AI terdepan terus melaju, dan perusahaan AI besar seperti OpenAI dan Anthropic tengah bergerak menuju IPO pada paruh akhir tahun ini
- Sentimen penolakan terhadap AI juga berlanjut, terutama di Amerika Serikat, di mana pemerintah daerah mulai menerima pembatasan atau pelarangan total terhadap pembangunan data center baru
- Melanjutkan liputan tahun-tahun sebelumnya dari 2021 hingga 2025, laporan ini memilih sejumlah tren yang merangkum kondisi AI pada 2026
Dominasi model AI Amerika Serikat
- Amerika Serikat memimpin peluncuran model AI yang menonjol selama 10 tahun terakhir, dan tren itu tetap berlanjut pada 2025
- Menurut Epoch AI, organisasi yang berbasis di Amerika Serikat merilis 50 model menonjol pada 2025
- Output Tiongkok mulai mempersempit jarak
- Hampir semua model menonjol lahir dari industri
- Peluncuran model menonjol dari industri pada 2025 mencapai 87 kasus
- Peluncuran dari sumber lain, termasuk akademia dan lembaga pemerintah, hanya 7 kasus
- Porsi industri telah melebar tajam dalam jangka panjang
- Model yang dirilis industri kini mencakup lebih dari 90 persen model menonjol
- Pada 2015 angkanya kurang dari 50 persen, dan pada 2003 adalah 0
Keunggulan Tiongkok dalam deployment robotika
- Perusahaan Amerika Serikat unggul dalam jumlah model AI yang menonjol, tetapi dalam deployment robotika, Tiongkok memiliki keunggulan yang jelas
- Berdasarkan data International Federation of Robotics, jumlah pemasangan robot industri di Tiongkok pada 2024 mencapai 295.000 unit
- Jepang memasang sekitar 44.500 unit, dan Amerika Serikat 34.200 unit
Lonjakan komputasi AI global
- Indikator total kapasitas komputasi AI dari Epoch AI ditampilkan sebagai angka representatif untuk ekspansi infrastruktur AI
- Dalam grafik yang menggunakan performa H100e Nvidia sebagai tolok ukur, kapasitas komputasi AI global telah meningkat lebih dari 3 kali lipat setiap tahun sejak 2022
- Jika 2021 dijadikan tahun pertama pelacakan, total komputasi AI telah naik 30 kali lipat
- Nvidia menjadi penerima manfaat terbesar dari ekspansi ini
- GPU Nvidia kini mencakup lebih dari 60 persen total kapasitas komputasi AI dunia
- Amazon dan Google, yang merancang hardware AI mereka sendiri, menyusul di belakangnya
Emisi karbon dari pelatihan dan inferensi AI
- Emisi karbon dari proses pelatihan AI sudah menjadi sorotan pada tahun sebelumnya, dan kekhawatiran itu berlanjut pada 2026
- Pelatihan large language model frontier terbaru diperkirakan menghasilkan emisi yang sangat besar
- Estimasi emisi pelatihan Grok 4 milik xAI melebihi 72.000 ton setara karbon
- GPT-4 milik OpenAI diperkirakan 5.184 ton, dan Llama 3.1 405B milik Meta 8.930 ton
- Ray Perrault menjelaskan bahwa angka-angka ini adalah estimasi dan meminta kehati-hatian dalam menafsirkannya
- “These estimates should be interpreted with caution”
- Untuk Grok, terdapat ketidakpastian karena sangat bergantung pada input yang diturunkan dari artikel Forbes, pernyataan xAI, dan sumber lain yang tidak dapat diverifikasi
- Epoch AI secara independen memperkirakan emisi Grok 4 lebih tinggi, sekitar 140.000 ton CO₂
- Emisi inferensi AI juga meningkat, dan perbedaannya antar model cukup besar
- Emisi model inferensi yang paling tidak efisien mencapai lebih dari 10 kali model yang paling efisien
- DeepSeek V3 diperkirakan mengonsumsi sekitar 23 watt saat merespons prompt dengan panjang sedang
- Claude 4 Opus diperkirakan mengonsumsi sekitar 5 watt
Akselerasi performa benchmark LLM
- Selama 10 tahun terakhir, performa model AI meningkat sangat cepat, dan laju kemajuannya di grafik tampak makin cepat
- Khususnya, LLM multimodal berkembang sampai pada tingkat yang hampir langsung menaklukkan benchmark baru yang dibuat
- Kenaikan paling curam terlihat di area agentic AI
- Dua garis paling curam di sisi kanan grafik adalah OSWorld benchmark, yang menilai penggunaan komputer secara otonom
- Serta benchmark rekayasa perangkat lunak SWE-Bench Verified, yang mengevaluasi coding otonom
- Performa di Humanity’s Last Exam juga meningkat pesat
- Dalam Stanford AI Index 2025, model peringkat pertama OpenAI o1 mencatat akurasi 8,8 persen
- Setelah itu, akurasinya naik hingga 38,3 persen
- Pada April 2026, model dengan skor tertinggi seperti Anthropic Claude Opus 4.6 dan Google Gemini 3.1 Pro telah melampaui 50 persen
- Ray Perrault mengingatkan soal hubungan antara benchmark dan performa di dunia nyata
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Ia menyebut bahwa akurasi 75 persen pada benchmark penalaran hukum saja tidak cukup untuk mengetahui apakah model itu benar-benar layak dipakai di firma hukum
Ekspansi riset AI di bidang medis
- Adopsi AI dalam riset medis meningkat cepat
- Jumlah paper tentang penemuan obat berbasis AI telah meningkat lebih dari 2 kali lipat dalam dua tahun terakhir
- Jumlah paper AI biomedis multimodal yang menangani citra medis dan teks sekaligus mencapai 2,7 kali dibanding dua tahun lalu
Batasan dalam membaca jam analog
- Berbeda dengan peningkatan pesat di beberapa area, kelemahan tetap terlihat pada tugas umum seperti membaca jam analog dan memahami kalender
- Dalam ClockBench, yang mengukur kemampuan LLM multimodal membaca jam analog, bahkan model dengan performa terbaik pun hanya punya peluang sukses sekitar setengah
- Peluang jawaban benar OpenAI GPT-5.4 adalah 50 banding 50
- Sebagian besar model mencatat hasil yang jauh lebih rendah
- Akurasi Anthropic Claude Opus 4.6 adalah 8,9 persen
- Disebutkan juga bahwa model yang sama meraih skor tingkat atas di Humanity’s Last Exam
- Ray Perrault mengaitkan hal ini dengan persoalan yang lebih umum
- Saat tugas menanyakan kombinasi bahasa dengan modalitas lain seperti gambar atau intonasi suara, komponen bahasa mengambil porsi yang lebih besar dari perkiraan
- Ia juga menyinggung alur riset yang menunjukkan hal ini dapat berlanjut sampai tingkat mengabaikan informasi nonbahasa sepenuhnya
Rekor tertinggi investasi AI pada 2025
- Seiring peningkatan performa model AI, investasi AI juga ikut naik
- Menurut data perusahaan analitik AI Quid, investasi AI pada 2025 mencetak rekor baru dengan melampaui 581 miliar dolar AS
- Lebih dari dua kali lipat dibanding 253 miliar dolar AS pada 2024
- Jauh melampaui rekor sebelumnya pada 2021 sebesar 360 miliar dolar AS
- Berbeda dengan 2021, rekor 2025 didorong bukan oleh merger dan akuisisi, melainkan oleh investasi swasta ke perusahaan AI
- Sebagian besar dana investasi mengalir ke Amerika Serikat
- Nilai investasi AI di Amerika Serikat tahun lalu mencapai lebih dari 344 miliar dolar AS
Fokus software engineer pada AI
- Jumlah proyek terkait AI di GitHub melonjak menjadi 5,58 juta pada 2025
- Sekitar 5 kali dibanding 2020
- Naik 23,7 persen dibanding 2024
- Kenaikan ini tampaknya bukan sekadar banjir proyek hasil generasi AI
- Jumlah proyek dengan lebih dari 10 stars juga tumbuh dengan kecepatan serupa
- Total stars yang diterima semua proyek AI juga meningkat dengan laju serupa
- Ini mengindikasikan adanya partisipasi manusia
- Salah satu contoh populer adalah software agentic AI open-source OpenClaw
- Meraih 352.000 stars di GitHub
- Ray Perrault mengakui bahwa proyek bot atau agen AI mungkin ikut memengaruhi euforia ini
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Ia juga menyebut bahwa menurut situs pelacakan aktivitas Agents in the Wild, yang tidak disebut dalam laporan Stanford, sebagian besar aktivitas GitHub masih tampak dilakukan manusia
- Euforia AI juga kuat dalam paper ilmu komputer
- Jumlah paper ilmu komputer terkait AI dalam 10 tahun terakhir naik dari 102.000 menjadi 258.000, lebih dari dua kali lipat
- Pada 2024, lebih dari 68 persen di antaranya berasal dari akademia
- Porsi pemerintah dan industri masing-masing sekitar 11,5 persen dan 12,5 persen
- Pertumbuhan dipimpin oleh bidang machine learning, computer vision, dan generative AI
Ketidakpastian dampak AI terhadap pekerjaan
- Kekhawatiran soal ketenagakerjaan meningkat seiring penyebaran generative AI, tetapi data saat ini menunjukkan hasil yang campuran
- Disajikan grafik jumlah tenaga kerja yang dinormalisasi menurut kelompok usia untuk pekerjaan yang dianggap berisiko tinggi tergantikan AI, seperti software developers dan customer support agents
- Pekerjaan level junior menurun
- Posisi menengah dan senior tetap bertahan atau meningkat
- Perubahan ini sulit ditafsirkan terpisah dari arus ekonomi yang lebih luas
- Laporan tersebut menyebut adanya kenaikan pengangguran di banyak jenis pekerjaan
- Bertentangan dengan perkiraan, kenaikan pengangguran pada pekerja dengan paparan AI paling rendah justru lebih besar dibanding pekerja dengan paparan AI paling tinggi
Perubahan persepsi publik terhadap AI
- Dalam survei Ipsos, optimisme terhadap AI meningkat tipis tetapi terlihat dalam beberapa tahun terakhir
- Respons “benefits outweigh the drawbacks” naik dari 55 persen pada 2024 menjadi 59 persen
- Respons yang menyatakan memahami AI dengan “good understanding” naik tipis dari 67 persen menjadi 68 persen
- Dalam pertanyaan serupa lainnya, penerimaan keseluruhan tetap lebih positif daripada negatif, tetapi beberapa sentimen negatif juga meningkat
- 52 persen responden mengatakan produk dan layanan yang menggunakan AI membuat mereka merasa “nervous”
- Perbedaannya besar antarnegara
- Negara-negara Asia Tenggara, termasuk Tiongkok, Malaysia, Thailand, Indonesia, dan Singapura, cenderung lebih positif
- Pergeseran paling positif secara tahunan terjadi di Germany 12 persen, France 10 persen, dan the Netherlands 10 persen
- Colombia mencatat pergeseran paling negatif dengan -6 persen
Perbedaan kepercayaan pada regulasi AI antarnegara
- Seiring meningkatnya persepsi bahwa AI akan membawa dampak positif, di beberapa negara juga muncul ketidakpercayaan yang mendalam terhadap kepercayaan pada regulasi pemerintah
- Amerika Serikat khususnya berada di kelompok terbawah dalam kepercayaan regulasi, meski menjadi pemimpin investasi AI
- Dalam survei Ipsos, responden Amerika Serikat yang mengatakan mereka percaya pada regulasi AI oleh pemerintah hanya 31 persen
- Banyak negara Eropa dan Jepang juga menunjukkan tingkat kepercayaan yang rendah
- Negara-negara di Asia dan Amerika Selatan menunjukkan kepercayaan tertinggi pada kemampuan pemerintah untuk mengatur AI
- Kontras antara Amerika Serikat dan Colombia tampak menonjol
- Amerika Serikat memiliki ketidakpercayaan mendalam terhadap regulasi AI, tetapi mayoritas responden menilai manfaat AI akan lebih besar daripada kekurangannya
- Colombia memiliki tingkat kepercayaan tinggi terhadap regulasi AI, tetapi sentimen terhadap AI secara umum justru memburuk
- Seperti versi mini dari narasi AI pada 2025, kualitas performa model dan persepsi terhadap dampak sosialnya sangat bervariasi tergantung tugas dan pertanyaannya
1 komentar
Komentar Hacker News
Saya ingin menyoroti bahwa pandangan generasi muda terhadap AI ternyata tidak sepositif yang dibayangkan. Jika melihat survei Gallup, skeptisisme itu tampak cukup jelas
Meskipun melatih satu frontier LLM terbaru menghasilkan emisi karbon lebih dari 72 ribu ton, dibandingkan dengan total tahunan global sebesar 38 miliar ton, menurut saya itu relatif kecil
Pada akhirnya saya rasa tidak ada pihak yang benar-benar akan memiliki moat, jadi grafik ini justru terasa seperti memperbesar ilusi para investor
Kepemimpinan Tiongkok di bidang robotika juga mencolok, tetapi yang paling pertama menarik perhatian saya justru grafik emisi Grok
Hanya karena jumlah pembuatan proyek GitHub meningkat lalu mengatakan "insinyur perangkat lunak all-in ke AI" terasa cukup konyol. Membuat satu repositori tidak otomatis menjadikan seseorang insinyur perangkat lunak, dan kalau iya, rasanya saya tidak perlu belajar hal lain
Bagian "Tiongkok memimpin di robotika" tampaknya hampir tidak ada hubungannya dengan AI. Grafik Tiongkok itu hampir mengikuti lintasan yang sama sejak 2012, jadi menurut saya chart tersebut tidak terlalu cocok dengan konteks artikel
Pernyataan "pelatihan model AI dapat menghasilkan emisi karbon yang sangat besar" memang benar, tetapi yang benar-benar ingin saya lihat adalah grafik tentang berapa banyak karbon yang dihasilkan dari operasi layanan model-model ini di seluruh dunia
Saya sulit setuju dengan kalimat "dalam 10 tahun terakhir kinerja model AI meningkat dengan kecepatan luar biasa, dan kemajuan itu makin cepat." Menurut saya hampir semua bidang sekarang sudah masuk ke fase plateau. Bidang yang baru mulai belakangan, seperti matematika kompetitif, mungkin tampak belum begitu, tetapi melihat pola grafik masa lalu, besar kemungkinan akhirnya akan mengalami stagnasi serupa
Saya masih belum benar-benar memahami ungkapan State of AI in 2026
Tulisan ini tampaknya postingan duplikat. Postingan aslinya ada di thread ini, dan sumbernya adalah 2026 AI Index Report dari Stanford HAI