- HBM naik dari 52% pada kuartal 1 2024 menjadi 63% pada kuartal 4 2025 berdasarkan rata-rata tertimbang volume produksi chip AI Nvidia, AMD, Google, dan Amazon
- Pada periode yang sama, porsi logic die hampir tetap di sekitar 13%, sementara packaging canggih turun dari 19% ke 15% dan komponen pendukung turun dari 15% ke 9%
- Belanja HBM empat perancang chip tersebut meningkat dari sekitar US$12 miliar pada 2024 menjadi US$32 miliar pada 2025, dengan laju pertumbuhan tahunan lebih cepat daripada komponen lain
- Total belanja komponen chip AI naik dari sekitar US$22 miliar menjadi US$52 miliar, dan HBM sendiri menyumbang sekitar US$20 miliar dari kenaikan tersebut
- Pada 2026, tekanan biaya bisa makin besar akibat kekurangan pasokan memori dan kenaikan harga, dan Microsoft serta Meta juga menyebut kenaikan harga komponen sebagai faktor peningkatan belanja modal
Perubahan utama
- Porsi high-bandwidth memory (HBM) dalam belanja komponen chip AI naik dari 52% pada kuartal 1 2024 menjadi 63% pada kuartal 4 2025
- Estimasi ini merupakan rata-rata tertimbang volume produksi untuk seluruh chip AI yang dirancang oleh Nvidia, AMD, Google, dan Amazon
- Pada periode yang sama, logic die hampir tidak berubah di kisaran 13%, packaging canggih turun dari 19% ke 15%, dan komponen pendukung turun dari 15% ke 9%
- Belanja HBM dari keempat perancang chip tersebut meningkat dari sekitar US$12 miliar pada 2024 menjadi US$32 miliar pada 2025, sehingga pertumbuhan tahunan lebih cepat dibanding komponen lain
- Total belanja komponen chip AI naik dari sekitar US$22 miliar pada 2024 menjadi sekitar US$52 miliar pada 2025, dan belanja HBM saja menyumbang sekitar US$20 miliar dari kenaikannya
Tekanan biaya pada 2026
Metode perhitungan dan cakupan data
- Untuk setiap chip AI yang dirancang Nvidia, AMD, Google, dan Amazon, diestimasi biaya per chip untuk memori, logic die, packaging canggih, dan komponen pendukung
- Total belanja komponen per kategori dihitung dengan mengalikan biaya komponen tiap chip dengan estimasi volume produksi per kuartal, lalu dihitung porsinya terhadap total belanja komponen dari kuartal 1 2024 hingga kuartal 4 2025
- Estimasi biaya komponen diambil dari AI Chip Components explorer, yang menyusun spesifikasi komponen per chip berdasarkan pengungkapan keuangan, materi pemasok, dan laporan analis
- Metodologi lengkap dapat dilihat di explorer’s methodology documentation
Kategori komponen
-
Memori
- Termasuk stack HBM, dengan cakupan HBM3 dan HBM3e
-
Logika
- Termasuk logic die proses canggih 3~5nm
-
Packaging
- Termasuk packaging canggih TSMC CoWoS
-
Komponen pendukung
- Termasuk substrat, catu daya, dan elemen input non-logika dan non-memori lainnya
Penanganan ketidakpastian
- Ada ketidakpastian biaya pada biaya per unit tiap komponen seperti harga stack HBM, harga logic die, dan harga paket CoWoS
- Biaya tiap komponen pada setiap chip dimodelkan dengan interval kepercayaan 90%
- Karena porsi komponen adalah biaya komponen tersebut dibagi total biaya, pembilang dan penyebut sama-sama tidak pasti
- Dua jenis rentang disajikan bersama
- Rentang saat hanya biaya komponen terkait yang berubah: porsi ketika biaya komponen tersebut berada di persentil ke-5 atau ke-95, sementara tiga komponen lain berada di median
- Rentang saat semua komponen berubah ke nilai ekstrem: porsi ketika komponen terkait berada di satu ujung interval kepercayaan, sementara semua komponen lain secara bersamaan berada di ujung yang berlawanan
Porsi komponen per kuartal
-
Kuartal 1 2024
- Porsi memori adalah 52%, dengan rentang 48~56% saat hanya biaya komponen terkait berubah, dan 42~62% saat semua komponen berubah ke nilai ekstrem
- Porsi logika adalah 14%, dengan rentang 12~17% saat hanya biaya komponen terkait berubah, dan 10~20% saat semua komponen berubah ke nilai ekstrem
- Porsi packaging adalah 19%, dengan rentang 14~24% saat hanya biaya komponen terkait berubah, dan 12~27% saat semua komponen berubah ke nilai ekstrem
- Porsi komponen pendukung adalah 15%, dengan rentang 13~18% saat hanya biaya komponen terkait berubah, dan 11~21% saat semua komponen berubah ke nilai ekstrem
-
Kuartal 4 2025
- Porsi memori adalah 63%, dengan rentang 60~67% saat hanya biaya komponen terkait berubah, dan 54~73% saat semua komponen berubah ke nilai ekstrem
- Porsi logika adalah 13%, dengan rentang 10~16% saat hanya biaya komponen terkait berubah, dan 9~19% saat semua komponen berubah ke nilai ekstrem
- Porsi packaging adalah 15%, dengan rentang 11~19% saat hanya biaya komponen terkait berubah, dan 9~22% saat semua komponen berubah ke nilai ekstrem
- Porsi komponen pendukung adalah 10%, dengan rentang 8~10% saat hanya biaya komponen terkait berubah, dan 7~12% saat semua komponen berubah ke nilai ekstrem
Asumsi dan keterbatasan
- Biaya komponen dapat berbeda tergantung kontrak, pemasok, dan waktu, sehingga terdapat ketidakpastian pada estimasi biaya per chip
- Ada juga ketidakpastian pada estimasi volume produksi chip per kuartal dan komposisi jenis chip, dan ketidakpastian ini tercermin dalam porsi yang dilaporkan
Data dan alat eksplorasi
1 komentar
Komentar Hacker News
Inferensi dan pelatihan AI tampaknya punya jalur untuk menurunkan biaya perangkat keras sekitar 3x dan biaya total sekitar 2x bahkan tanpa inovasi teknologi sama sekali
Asalkan pasokan DRAM bisa mengejar permintaan, baik lewat ekspansi manufaktur maupun sekadar memenuhi lonjakan permintaan dengan laju produksi saat ini, ini hanya soal waktu
Ada banyak hal yang patut dikritik dari ucapan-ucapan yang Sam Altman sebarkan secara kultural, tetapi dalam jangka panjang, pernyataan bahwa “saat ini adalah yang terburuk dibanding masa depan” tampak seperti poin yang cukup menarik dan diremehkan
Dalam 10 tahun, melatih LLM pada level saat ini tampaknya akan menjadi prasyarat dasar seperti menjalankan basis data sekarang. Tingkat saat ini saja sudah cukup canggih, dan terlepas dari perkembangan perangkat keras, sepertinya masih ada banyak ruang untuk naik hanya dengan membuat sistem pelatihan reinforcement learning yang lebih baik
Sangat disarankan melihat proyek GitHub dan HF milik Allen Institute. Ada materi pelatihan open source seperti data untuk melatih LLM dari awal dengan Common Crawl dan tuning menarik untuk qwen, jadi kita bisa mendapat gambaran seperti apa proyek sampingan sore hari atau materi edukasi dalam waktu dekat
Industri ini cenderung menjaga pasar dalam kondisi kekurangan pasokan, karena kalau tidak, kelebihan pasokan yang menyusul akan menghancurkan para perusahaan itu. Sebagai gantinya, pasokan dari area yang kurang menguntungkan seperti mobile dan komputasi pribadi hanya akan dialihkan ke area yang lebih menguntungkan
Floating-point IEEE terkenal buruk pada lebar bit rendah, khususnya 16-bit ke bawah. Format seperti posit jauh lebih baik pada 16-bit atau 8-bit. Jika pelatihan bisa dilakukan dengan 16 bit per nilai alih-alih 32 bit, dan kehilangan akurasinya jauh lebih kecil dibanding saat berpindah dari IEEE32 ke IEEE16, itu cukup berarti
Beberapa tahun lalu saya membeli RAM 96GB sekitar 250 dolar, dan RAM yang sama sekarang harganya 1.200 dolar
Di Amazon, kit yang sama sekarang 1.048,90 dolar
Modul memori enterprise bekas benar-benar dijual sangat murah di eBay
Sekarang harganya sekitar 22 dolar per modul, jadi totalnya kira-kira 350 dolar. Saya benar-benar tidak tahu siapa yang sedang melakukan apa dengan DDR3
Nilai SSD supercepat seperti Optane bisa naik jauh lebih besar
Dari semua yang saya baca, kapasitas RAM tampaknya akan naik sekitar 20~25% per tahun, tetapi itu rasanya tidak cukup
Bahkan untuk penggunaan konsumen, ponsel dan laptop akan jauh lebih baik jika RAM-nya berlipat ganda, belum lagi permintaan AI yang sangat besar
Tren ini tampaknya tidak akan hilang. Mungkin tidak akan tumbuh secepat sekarang, tetapi juga tidak akan lenyap. Saya paham kenapa perusahaan memori tidak ingin membangkrutkan diri sendiri, tetapi seharusnya ada cara untuk memindahkan risiko itu ke penyedia model atau peserta ekosistem lain sambil menaikkan kapasitas RAM mendekati 50% per tahun
Di pasar yang kompetitif, tidak efisien jika perusahaan RAM tidak menjual sambil masih menyisakan pembeli
Saya tidak tahu berapa tingkat pertumbuhan sebenarnya sebelum Oktober, tetapi mungkin ada orang di sini yang tahu
Soal 20~25% pertumbuhan yang dianggap tidak cukup, saya rasa itu bukan angka yang terlalu meleset jika diasumsikan rencana ekspansi data center menabrak tembok dan demam AI mereda
Dalam jangka pendek, 20~25% mungkin tidak cukup, tetapi jika ekspansi AI berhenti tahun ini, yang terjadi bukan kekurangan pasokan melainkan kelebihan pasokan besar-besaran
Karena itu memungkinkan pemasok DRAM melakukan lindung nilai atas risiko tersebut
Bagaimana jika semua orang membeli komputer, misalnya, 1/3 lebih lambat, lalu semuanya beralih ke HBM, dan itu ternyata lebih menguntungkan?
Kesenjangan antara performa komputasi dan memori sudah lama makin lebar, dan mungkin beralih ke HBM, meski menyakitkan, justru memang yang dibutuhkan
Lebih baik punya tiga komputer kelas menengah dengan bandwidth memori rendah, atau secara statistik menunggu sedikit lebih lama sehingga semua orang membeli komputer baru yang 1/3 lebih lambat dari sisi rasio area tetapi mendapatkan bandwidth jauh lebih tinggi?
Dengan tren sekarang, saya benar-benar penasaran bagaimana pasar konsumen seperti game atau machine learning akan bertahan
Cloud gaming jelas akan datang di masa depan, dan mungkin hanya puris seperti saya yang akan membeli RTX 5090 lalu membayar premium untuk gaming offline
Karena secara ekonomi lebih efisien untuk menyusutkan biaya perangkat keras yang dibutuhkan untuk rendering grafis ke banyak konsumen, tidak membiarkannya menganggur saat tidak digunakan, dan menempatkannya di POP bersama aset game
Jika komputasi game yang cukup berjalan di edge, game yang secara teknis lebih maju namun saat ini tidak layak secara ekonomi pun bisa jadi mungkin. Menurut saya, alasan kenapa belum banyak game seperti itu sekarang adalah karena pasar dan adopsi cloud gaming masih kurang, sehingga pengetahuan teknisnya juga masih minim
Saat biaya untuk merender game yang ingin dimainkan dengan perangkat keras konsumen jadi sulit ditanggung, kemungkinan besar orang-orang yang selama ini bertahan pun akhirnya akan terbujuk dan pendekatan ini akan mapan
Saya tidak akan pindah dari build DDR4 sampai harga setidaknya sedikit kembali masuk akal
Saya masih punya memori cadangan DDR4 2133MHz 32GB yang saya beli dulu, dan sekarang memakai 3200MHz. Itu berarti pabrikan CPU juga tidak akan mendapatkan uang saya. 5800X masih cukup untuk sementara, dan tidak ada alasan membeli GPU baru. Tentu saja B580 tidak sempurna, tetapi tetap saja
Sangat ironis bahwa Iran memblokir pasokan helium
Pada saat yang sama, Iran bergantung pada propaganda murahan buatan AI untuk mengguncang musuhnya. Rasanya seperti salah satu ironi sejarah yang baru terlihat belakangan
Ini masa yang benar-benar buruk bagi gamer dan pehobi PC yang tidak sepenuhnya tenggelam dalam AI
Saat saya mulai merakit PC gaming, kartu grafis kelas atas harganya 750 dolar Selandia Baru. Sekarang GPU saja 10.000 dolar, dan RAM menambah 1.000~2.000 dolar lagi
Dulu PC gaming adalah hobi yang masih terjangkau, sekarang sampai-sampai hobi penerbangan umum terlihat seperti alternatif
Dalam jangka pendek para pehobi memang tertekan, tetapi modal untuk mendorong teknologi tercanggih masih kecil dibanding perusahaan Fortune 500. Sebentar lagi pehobi juga akan ikut menikmati manfaatnya, terutama jika pasar runtuh
Saya penasaran kenapa hyperscaler tidak melakukan integrasi vertikal lebih jauh dan membangun fab mereka sendiri
Sekalipun satu fab bernilai 1 miliar dolar, sekarang mereka menghabiskan ratusan miliar dolar untuk membeli chip dari Nvidia dan perusahaan lain
Tetapi fakta bahwa hyperscaler dan perusahaan AI tidak melakukan itu mengatakan banyak hal tentang seberapa besar mereka benar-benar percaya pada permintaan AI masa depan
Perusahaan AI mengklaim ekspansi skala sangat besar akan dibutuhkan, tetapi mereka tidak mau menanggung risiko modal yang dibutuhkan untuk ekspansi itu
Kita sering mendengar keluhan sedih dari pihak AI bahwa produsen chip menghambat mereka, tetapi siapa sebenarnya yang punya uang untuk dengan mudah membiayai ekspansi itu? Produsen chip sudah jauh lebih lama bermain di arena ini. Ketika Sam Altman berkeliling bicara bahwa dibutuhkan fab senilai 7 triliun dolar, perusahaan AI menunjukkan bahwa mereka siap membuat klaim tak masuk akal dan kehilangan kredibilitas
Yang dibutuhkan sekarang adalah mengalirkan sebagian sangat kecil dari kas besar yang mereka timbun langsung ke pembiayaan fab
Ini semacam “ilmu roket” masa kini, dan tidak cukup hanya punya uang. Sangat mungkin miliaran dolar habis tanpa hasil apa pun
Lihat saja betapa beratnya Intel bersaing dalam beberapa tahun terakhir. Mereka sudah puluhan tahun berkecimpung di bisnis ini
Kalau tidak punya keahlian itu, perlu eksperimen tambahan sebelum bisa bersaing dengan produsen yang ada. Saat akhirnya bisa memproduksi chip yang layak pakai, kekurangan pasokan mungkin sudah berakhir
Mungkin ini bukan bisnis yang ingin mereka integrasikan
Selain itu, dibutuhkan keahlian yang tidak dimiliki satu pun dari perusahaan-perusahaan ini
Seminggu lalu saya membeli server Dell bekas
Harga seluruh perangkat dengan CPU 12-core dan RAM DDR4 ECC 32GB hampir sama dengan harga membeli RAM DDR 64GB saja. Saya berharap situasi absurd ini segera berakhir. Kalau tidak, dampaknya akan menyebar ke pasar lain juga. Belum lama ini saya membaca tulisan bahwa penjualan casing PC turun lebih dari 40%
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
Pabrikan yang tadinya membuat komponen “enterprise” tidak akan kembali ke pasar komponen konsumen. Saat itu pasar tersebut sudah tidak ada
Dan ketika data center yang tidak bisa menghasilkan uang dari keluaran berkualitas rendah mulai berlimpah, semuanya akan didaur ulang untuk SaaS. Semacam OnShape yang meluas ke semua aplikasi
Sebagian besar pengguna tampaknya tidak terlalu peduli jika semua yang mereka hasilkan disimpan di layanan cloud, dan itu bisa dengan mudah dijual sebagai alternatif dari memiliki perangkat keras desktop atau laptop yang “mahal”
Jika hyperscaler memakai lebih banyak RAM dan RAM itu tidak dipasok ke konsumen, artinya semua pekerjaan berat akan terjadi di cloud
Kenapa hyperscaler dan konsumen harus sama-sama memiliki RAM? Konsumen memang ingin lebih banyak RAM untuk menjalankan model lokal, tetapi kalau begitu kapasitas hyperscaler malah akan menganggur
Pabrikan memori memegang hak kekayaan intelektual setumpuk
Jadi meskipun ada pihak yang punya kapasitas fab cadangan dan ingin masuk ke produksi memori, mereka harus melawan hambatan paten yang sangat besar
Sebagian besar perusahaan memori punya kesepakatan belakang layar untuk saling meniadakan tuduhan pelanggaran paten satu sama lain
Saya benar-benar tidak tahu bagaimana produsen memori baru bisa muncul tanpa tenggelam oleh biaya lisensi