Grafik-grafik yang menjelaskan kondisi AI pada 2026

(spectrum.ieee.org)

3 poin oleh GN⁺ 2026-04-20 | 1 komentar | Bagikan ke WhatsApp

AI Index 2026 adalah laporan yang merangkum tren AI secara keseluruhan lewat indikator seperti performa benchmark, investasi, persepsi publik, komputasi, dan emisi karbon
Peluncuran model AI yang menonjol terus didominasi Amerika Serikat dan industri, sementara Tiongkok mencatat keunggulan yang jelas dalam pemasangan robot industri
Kapasitas komputasi AI global telah meningkat lebih dari 3 kali lipat setiap tahun sejak 2022, dan GPU Nvidia kini mencakup lebih dari 60 persen dari total kapasitas
Performa benchmark LLM multimodal dan agentic AI meningkat cepat, tetapi untuk tugas umum seperti membaca jam analog, akurasinya tetap rendah
Investasi AI pada 2025 mencetak rekor tertinggi dengan melampaui 581 miliar dolar AS, sementara dampak ketenagakerjaan, kepercayaan pada regulasi, dan penerimaan publik menunjukkan perbedaan besar antarnegara dan antarindikator

Indikator utama dari laporan AI Index 2026

Laporan AI Index 2026 Stanford yang panjangnya lebih dari 400 halaman merangkum kondisi AI dari berbagai sudut seperti skor benchmark, investasi, dan persepsi publik
Performa model AI terdepan terus melaju, dan perusahaan AI besar seperti OpenAI dan Anthropic tengah bergerak menuju IPO pada paruh akhir tahun ini
Sentimen penolakan terhadap AI juga berlanjut, terutama di Amerika Serikat, di mana pemerintah daerah mulai menerima pembatasan atau pelarangan total terhadap pembangunan data center baru
Melanjutkan liputan tahun-tahun sebelumnya dari 2021 hingga 2025, laporan ini memilih sejumlah tren yang merangkum kondisi AI pada 2026

Dominasi model AI Amerika Serikat

Amerika Serikat memimpin peluncuran model AI yang menonjol selama 10 tahun terakhir, dan tren itu tetap berlanjut pada 2025
- Menurut Epoch AI, organisasi yang berbasis di Amerika Serikat merilis 50 model menonjol pada 2025
- Output Tiongkok mulai mempersempit jarak
Hampir semua model menonjol lahir dari industri
- Peluncuran model menonjol dari industri pada 2025 mencapai 87 kasus
- Peluncuran dari sumber lain, termasuk akademia dan lembaga pemerintah, hanya 7 kasus
Porsi industri telah melebar tajam dalam jangka panjang
- Model yang dirilis industri kini mencakup lebih dari 90 persen model menonjol
- Pada 2015 angkanya kurang dari 50 persen, dan pada 2003 adalah 0

Keunggulan Tiongkok dalam deployment robotika

Perusahaan Amerika Serikat unggul dalam jumlah model AI yang menonjol, tetapi dalam deployment robotika, Tiongkok memiliki keunggulan yang jelas
- Berdasarkan data International Federation of Robotics, jumlah pemasangan robot industri di Tiongkok pada 2024 mencapai 295.000 unit
- Jepang memasang sekitar 44.500 unit, dan Amerika Serikat 34.200 unit

Lonjakan komputasi AI global

Indikator total kapasitas komputasi AI dari Epoch AI ditampilkan sebagai angka representatif untuk ekspansi infrastruktur AI
Dalam grafik yang menggunakan performa H100e Nvidia sebagai tolok ukur, kapasitas komputasi AI global telah meningkat lebih dari 3 kali lipat setiap tahun sejak 2022
- Jika 2021 dijadikan tahun pertama pelacakan, total komputasi AI telah naik 30 kali lipat
Nvidia menjadi penerima manfaat terbesar dari ekspansi ini
- GPU Nvidia kini mencakup lebih dari 60 persen total kapasitas komputasi AI dunia
- Amazon dan Google, yang merancang hardware AI mereka sendiri, menyusul di belakangnya

Emisi karbon dari pelatihan dan inferensi AI

Emisi karbon dari proses pelatihan AI sudah menjadi sorotan pada tahun sebelumnya, dan kekhawatiran itu berlanjut pada 2026
Pelatihan large language model frontier terbaru diperkirakan menghasilkan emisi yang sangat besar
- Estimasi emisi pelatihan Grok 4 milik xAI melebihi 72.000 ton setara karbon
- GPT-4 milik OpenAI diperkirakan 5.184 ton, dan Llama 3.1 405B milik Meta 8.930 ton
Ray Perrault menjelaskan bahwa angka-angka ini adalah estimasi dan meminta kehati-hatian dalam menafsirkannya
- “These estimates should be interpreted with caution”
- Untuk Grok, terdapat ketidakpastian karena sangat bergantung pada input yang diturunkan dari artikel Forbes, pernyataan xAI, dan sumber lain yang tidak dapat diverifikasi
- Epoch AI secara independen memperkirakan emisi Grok 4 lebih tinggi, sekitar 140.000 ton CO₂
Emisi inferensi AI juga meningkat, dan perbedaannya antar model cukup besar
- Emisi model inferensi yang paling tidak efisien mencapai lebih dari 10 kali model yang paling efisien
- DeepSeek V3 diperkirakan mengonsumsi sekitar 23 watt saat merespons prompt dengan panjang sedang
- Claude 4 Opus diperkirakan mengonsumsi sekitar 5 watt

Akselerasi performa benchmark LLM

Selama 10 tahun terakhir, performa model AI meningkat sangat cepat, dan laju kemajuannya di grafik tampak makin cepat
Khususnya, LLM multimodal berkembang sampai pada tingkat yang hampir langsung menaklukkan benchmark baru yang dibuat
Kenaikan paling curam terlihat di area agentic AI
- Dua garis paling curam di sisi kanan grafik adalah OSWorld benchmark, yang menilai penggunaan komputer secara otonom
- Serta benchmark rekayasa perangkat lunak SWE-Bench Verified, yang mengevaluasi coding otonom
Performa di Humanity’s Last Exam juga meningkat pesat
- Dalam Stanford AI Index 2025, model peringkat pertama OpenAI o1 mencatat akurasi 8,8 persen
- Setelah itu, akurasinya naik hingga 38,3 persen
- Pada April 2026, model dengan skor tertinggi seperti Anthropic Claude Opus 4.6 dan Google Gemini 3.1 Pro telah melampaui 50 persen
Ray Perrault mengingatkan soal hubungan antara benchmark dan performa di dunia nyata
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- Ia menyebut bahwa akurasi 75 persen pada benchmark penalaran hukum saja tidak cukup untuk mengetahui apakah model itu benar-benar layak dipakai di firma hukum

Ekspansi riset AI di bidang medis

Adopsi AI dalam riset medis meningkat cepat
Jumlah paper tentang penemuan obat berbasis AI telah meningkat lebih dari 2 kali lipat dalam dua tahun terakhir
Jumlah paper AI biomedis multimodal yang menangani citra medis dan teks sekaligus mencapai 2,7 kali dibanding dua tahun lalu

Batasan dalam membaca jam analog

Berbeda dengan peningkatan pesat di beberapa area, kelemahan tetap terlihat pada tugas umum seperti membaca jam analog dan memahami kalender
Dalam ClockBench, yang mengukur kemampuan LLM multimodal membaca jam analog, bahkan model dengan performa terbaik pun hanya punya peluang sukses sekitar setengah
- Peluang jawaban benar OpenAI GPT-5.4 adalah 50 banding 50
Sebagian besar model mencatat hasil yang jauh lebih rendah
- Akurasi Anthropic Claude Opus 4.6 adalah 8,9 persen
- Disebutkan juga bahwa model yang sama meraih skor tingkat atas di Humanity’s Last Exam
Ray Perrault mengaitkan hal ini dengan persoalan yang lebih umum
- Saat tugas menanyakan kombinasi bahasa dengan modalitas lain seperti gambar atau intonasi suara, komponen bahasa mengambil porsi yang lebih besar dari perkiraan
- Ia juga menyinggung alur riset yang menunjukkan hal ini dapat berlanjut sampai tingkat mengabaikan informasi nonbahasa sepenuhnya

Rekor tertinggi investasi AI pada 2025

Seiring peningkatan performa model AI, investasi AI juga ikut naik
Menurut data perusahaan analitik AI Quid, investasi AI pada 2025 mencetak rekor baru dengan melampaui 581 miliar dolar AS
- Lebih dari dua kali lipat dibanding 253 miliar dolar AS pada 2024
- Jauh melampaui rekor sebelumnya pada 2021 sebesar 360 miliar dolar AS
Berbeda dengan 2021, rekor 2025 didorong bukan oleh merger dan akuisisi, melainkan oleh investasi swasta ke perusahaan AI
Sebagian besar dana investasi mengalir ke Amerika Serikat
- Nilai investasi AI di Amerika Serikat tahun lalu mencapai lebih dari 344 miliar dolar AS

Fokus software engineer pada AI

Jumlah proyek terkait AI di GitHub melonjak menjadi 5,58 juta pada 2025
- Sekitar 5 kali dibanding 2020
- Naik 23,7 persen dibanding 2024
Kenaikan ini tampaknya bukan sekadar banjir proyek hasil generasi AI
- Jumlah proyek dengan lebih dari 10 stars juga tumbuh dengan kecepatan serupa
- Total stars yang diterima semua proyek AI juga meningkat dengan laju serupa
- Ini mengindikasikan adanya partisipasi manusia
Salah satu contoh populer adalah software agentic AI open-source OpenClaw
- Meraih 352.000 stars di GitHub
Ray Perrault mengakui bahwa proyek bot atau agen AI mungkin ikut memengaruhi euforia ini
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Ia juga menyebut bahwa menurut situs pelacakan aktivitas Agents in the Wild, yang tidak disebut dalam laporan Stanford, sebagian besar aktivitas GitHub masih tampak dilakukan manusia
Euforia AI juga kuat dalam paper ilmu komputer
- Jumlah paper ilmu komputer terkait AI dalam 10 tahun terakhir naik dari 102.000 menjadi 258.000, lebih dari dua kali lipat
- Pada 2024, lebih dari 68 persen di antaranya berasal dari akademia
- Porsi pemerintah dan industri masing-masing sekitar 11,5 persen dan 12,5 persen
- Pertumbuhan dipimpin oleh bidang machine learning, computer vision, dan generative AI

Ketidakpastian dampak AI terhadap pekerjaan

Kekhawatiran soal ketenagakerjaan meningkat seiring penyebaran generative AI, tetapi data saat ini menunjukkan hasil yang campuran
Disajikan grafik jumlah tenaga kerja yang dinormalisasi menurut kelompok usia untuk pekerjaan yang dianggap berisiko tinggi tergantikan AI, seperti software developers dan customer support agents
- Pekerjaan level junior menurun
- Posisi menengah dan senior tetap bertahan atau meningkat
Perubahan ini sulit ditafsirkan terpisah dari arus ekonomi yang lebih luas
- Laporan tersebut menyebut adanya kenaikan pengangguran di banyak jenis pekerjaan
- Bertentangan dengan perkiraan, kenaikan pengangguran pada pekerja dengan paparan AI paling rendah justru lebih besar dibanding pekerja dengan paparan AI paling tinggi

Perubahan persepsi publik terhadap AI

Dalam survei Ipsos, optimisme terhadap AI meningkat tipis tetapi terlihat dalam beberapa tahun terakhir
- Respons “benefits outweigh the drawbacks” naik dari 55 persen pada 2024 menjadi 59 persen
- Respons yang menyatakan memahami AI dengan “good understanding” naik tipis dari 67 persen menjadi 68 persen
Dalam pertanyaan serupa lainnya, penerimaan keseluruhan tetap lebih positif daripada negatif, tetapi beberapa sentimen negatif juga meningkat
- 52 persen responden mengatakan produk dan layanan yang menggunakan AI membuat mereka merasa “nervous”
Perbedaannya besar antarnegara
- Negara-negara Asia Tenggara, termasuk Tiongkok, Malaysia, Thailand, Indonesia, dan Singapura, cenderung lebih positif
- Pergeseran paling positif secara tahunan terjadi di Germany 12 persen, France 10 persen, dan the Netherlands 10 persen
- Colombia mencatat pergeseran paling negatif dengan -6 persen

Perbedaan kepercayaan pada regulasi AI antarnegara

Seiring meningkatnya persepsi bahwa AI akan membawa dampak positif, di beberapa negara juga muncul ketidakpercayaan yang mendalam terhadap kepercayaan pada regulasi pemerintah
Amerika Serikat khususnya berada di kelompok terbawah dalam kepercayaan regulasi, meski menjadi pemimpin investasi AI
- Dalam survei Ipsos, responden Amerika Serikat yang mengatakan mereka percaya pada regulasi AI oleh pemerintah hanya 31 persen
Banyak negara Eropa dan Jepang juga menunjukkan tingkat kepercayaan yang rendah
Negara-negara di Asia dan Amerika Selatan menunjukkan kepercayaan tertinggi pada kemampuan pemerintah untuk mengatur AI
Kontras antara Amerika Serikat dan Colombia tampak menonjol
- Amerika Serikat memiliki ketidakpercayaan mendalam terhadap regulasi AI, tetapi mayoritas responden menilai manfaat AI akan lebih besar daripada kekurangannya
- Colombia memiliki tingkat kepercayaan tinggi terhadap regulasi AI, tetapi sentimen terhadap AI secara umum justru memburuk
Seperti versi mini dari narasi AI pada 2025, kualitas performa model dan persepsi terhadap dampak sosialnya sangat bervariasi tergantung tugas dan pertanyaannya

1 komentar

GN⁺ 2026-04-20

Komentar Hacker News

Saya ingin menyoroti bahwa pandangan generasi muda terhadap AI ternyata tidak sepositif yang dibayangkan. Jika melihat survei Gallup, skeptisisme itu tampak cukup jelas
- Saya melihat ini sebagai proses pelan-pelan mengenali keterbatasan mendasar AI
- Saya rasa suasana ini hanya sementara. Seperti setiap transisi teknologi baru sepanjang sejarah, pada akhirnya semua orang akan beradaptasi dan menemukan cara memanfaatkannya
Meskipun melatih satu frontier LLM terbaru menghasilkan emisi karbon lebih dari 72 ribu ton, dibandingkan dengan total tahunan global sebesar 38 miliar ton, menurut saya itu relatif kecil
- Menurut saya, emisi pelatihan satu LLM yang setara dengan emisi tahunan 17 ribu orang sama sekali bukan hal sepele. Berdasarkan artikelnya, itu naik 8 kali lipat dibanding tahun lalu dan mungkin juga diremehkan sekitar 2 kali. Selain itu, perangkat keras, bot pengumpulan data pelatihan, dan pemrosesan prompt dalam penggunaan sehari-hari juga tidak dihitung; model besar seperti ini ada banyak, dan model kecil ada ribuan hingga puluhan ribu. Perkiraan bahwa total emisi AI tahun ini melampaui 80 juta ton CO2e lebih besar daripada emisi seluruh negara seperti Austria atau Israel, jadi jelas tidak bisa dianggap enteng
- Saya juga merasa ini bisa dilihat dari sisi lain. Jika melatih satu model memerlukan 72 ribu ton dan model itu dipakai 100 juta orang, maka per orang hanya sekitar 0,00072 ton. Menurut artikel, rata-rata emisi tahunan manusia lebih dari 5 ton, dan orang Amerika sekitar 18 ton, jadi menambahkan 0,00072 hampir tidak akan terasa. Tentu saja biaya inferensi terpisah
- Bahkan dengan mempertimbangkan bahwa xAI tampaknya sengaja memilih intensitas karbon yang lebih tinggi, menurut saya angka ini pada dasarnya tetap sangat kecil. Lagi pula, memilih dua model utama tahun 2025 dan ternyata keduanya Grok terasa agak lucu, karena itu berarti mengambil model yang pada tahun tersebut termasuk yang paling tidak berguna, paling jarang dipakai, dan paling tidak menarik
Pada akhirnya saya rasa tidak ada pihak yang benar-benar akan memiliki moat, jadi grafik ini justru terasa seperti memperbesar ilusi para investor
- Saya rasa moat yang jelas memang akan muncul. Perusahaan bisa memusatkan anggaran pada kualitas token, atau memakai token yang lebih sedikit tetapi lebih baik. Jika ditambah basis pengguna dan engagement, itu bisa menciptakan flywheel yang sulit dikejar pendatang baru. Pasar itu kompleks, dan terlalu menyederhanakannya membuat banyak hal terlewat
- Menurut saya modal dan momentum itu sendiri juga merupakan moat. Memang model-model Tiongkok memakai distillation, tetapi sejauh ini kita belum banyak melihat mereka melatih model skala besar benar-benar dari nol. Namun jika chip makin murah dan chip buatan Tiongkok mulai matang, situasinya bisa berubah
Kepemimpinan Tiongkok di bidang robotika juga mencolok, tetapi yang paling pertama menarik perhatian saya justru grafik emisi Grok
- Melihat kalimat dalam artikel, "estimasi ini harus ditafsirkan dengan hati-hati dan untuk Grok sangat bergantung pada input yang diinferensikan dari laporan publik", grafik itu terasa agak meragukan dari sisi keandalannya
Hanya karena jumlah pembuatan proyek GitHub meningkat lalu mengatakan "insinyur perangkat lunak all-in ke AI" terasa cukup konyol. Membuat satu repositori tidak otomatis menjadikan seseorang insinyur perangkat lunak, dan kalau iya, rasanya saya tidak perlu belajar hal lain
- Saya setuju bahwa metrik itu tidak bagus, dan saya rasa lebih baik diganti dengan metrik seperti Claude Code GitHub Commits Over Time. Tentu itu juga tidak sempurna, tetapi setidaknya sedikit kurang cacat sebagai metrik dan terasa lebih mampu menunjukkan tren yang benar-benar berarti
Bagian "Tiongkok memimpin di robotika" tampaknya hampir tidak ada hubungannya dengan AI. Grafik Tiongkok itu hampir mengikuti lintasan yang sama sejak 2012, jadi menurut saya chart tersebut tidak terlalu cocok dengan konteks artikel
- Walaupun ChatGPT belum ada saat itu, menurut saya teknologi ML yang menggerakkan robotika sudah cukup berfungsi bahkan pada periode tersebut
Pernyataan "pelatihan model AI dapat menghasilkan emisi karbon yang sangat besar" memang benar, tetapi yang benar-benar ingin saya lihat adalah grafik tentang berapa banyak karbon yang dihasilkan dari operasi layanan model-model ini di seluruh dunia
Saya sulit setuju dengan kalimat "dalam 10 tahun terakhir kinerja model AI meningkat dengan kecepatan luar biasa, dan kemajuan itu makin cepat." Menurut saya hampir semua bidang sekarang sudah masuk ke fase plateau. Bidang yang baru mulai belakangan, seperti matematika kompetitif, mungkin tampak belum begitu, tetapi melihat pola grafik masa lalu, besar kemungkinan akhirnya akan mengalami stagnasi serupa
Saya masih belum benar-benar memahami ungkapan State of AI in 2026
Tulisan ini tampaknya postingan duplikat. Postingan aslinya ada di thread ini, dan sumbernya adalah 2026 AI Index Report dari Stanford HAI

Grafik-grafik yang menjelaskan kondisi AI pada 2026

Indikator utama dari laporan AI Index 2026

Dominasi model AI Amerika Serikat

Keunggulan Tiongkok dalam deployment robotika

Lonjakan komputasi AI global

Emisi karbon dari pelatihan dan inferensi AI

Akselerasi performa benchmark LLM

Ekspansi riset AI di bidang medis

Batasan dalam membaca jam analog

Rekor tertinggi investasi AI pada 2025

Fokus software engineer pada AI

Ketidakpastian dampak AI terhadap pekerjaan

Perubahan persepsi publik terhadap AI

Perbedaan kepercayaan pada regulasi AI antarnegara

Bacaan terkait

1 komentar

Komentar Hacker News