1 poin oleh GN⁺ 2026-01-07 | 1 komentar | Bagikan ke WhatsApp
  • AWS menaikkan harga instance GPU EC2 Capacity Blocks for ML sekitar 15%, dengan tarif per jam untuk instance p5e.48xlarge dan p5en.48xlarge naik di sebagian besar wilayah masing-masing dari $34.61→$39.80 dan $36.18→$41.61
  • Di region US West (Northern California), kenaikannya lebih besar, dari $43.26→$49.75
  • Melalui email, AWS menjelaskan bahwa “penyesuaian kali ini mencerminkan pola penawaran dan permintaan
  • Kenaikan ini terjadi setelah pengumuman sebelumnya tentang penurunan hingga 45% untuk instance GPU (7 bulan lalu), dan merupakan kasus langka di mana AWS secara langsung menaikkan harga
  • Peristiwa ini dianggap sebagai patahnya aturan tak tertulis penurunan harga di industri cloud, dan berpotensi memengaruhi layanan resource lain ke depan

Ikhtisar kenaikan harga GPU AWS

  • AWS menaikkan harga EC2 Capacity Blocks for ML sekitar 15% pada akhir pekan, tepatnya hari Sabtu
    • Instance p5e.48xlarge naik dari $34.61 menjadi $39.80 per jam, dan p5en.48xlarge dari $36.18 menjadi $41.61
    • Di region US West (Northern California), kenaikannya lebih besar, dari $43.26 menjadi $49.75
  • Di halaman harga resmi AWS ada kalimat bahwa “harga akan diperbarui pada Januari 2026”, tetapi tidak disebutkan bahwa arahnya adalah kenaikan
  • Melalui email, AWS menjelaskan bahwa “harga berfluktuasi mengikuti pola penawaran dan permintaan, dan penyesuaian kali ini mencerminkan pola yang diperkirakan untuk kuartal tersebut”

Karakter Capacity Blocks dan pengguna utamanya

  • Capacity Blocks adalah layanan untuk memesan dan menjamin resource GPU pada waktu tertentu, agar pekerjaan pelatihan ML dapat berjalan lebih stabil
    • Pengguna dapat memesan instance GPU untuk periode tertentu, dari satu hari hingga beberapa minggu ke depan, lalu membayar tarif tetap di muka
  • Pelanggan yang memakai layanan ini umumnya adalah tim perusahaan yang menjalankan proyek ML berskala besar, dengan anggaran mencapai jutaan dolar
  • Tujuh bulan lalu AWS pernah menurunkan harga on-demand dan Savings Plans untuk instance GPU hingga 45%, tetapi kenaikan kali ini hanya berlaku untuk Capacity Blocks

Dampak terhadap industri dan pelanggan

  • AWS memang pernah menyesuaikan harga sebelumnya, tetapi kenaikan langsung per item (line-item increase) adalah kasus yang jarang
    • Sebelumnya, pendekatan yang umum adalah mengubah struktur harga atau mempromosikannya sebagai “memberikan efek penurunan bagi sebagian besar pelanggan”
  • Kenaikan kali ini memberi bahan perbandingan yang menguntungkan bagi Azure dan GCP
    • Kedua pesaing tersebut sedang aktif menarik workload ML, dan fakta bahwa “AWS menaikkan harga GPU 15%” berpotensi dipakai sebagai senjata penjualan
  • Pelanggan enterprise yang menggunakan Enterprise Discount Program (EDP) tetap akan menghadapi kenaikan biaya riil karena harga dasar naik, meski tingkat diskonnya dipertahankan

Kondisi pasar dan prospek ke depan

  • Di tengah pasokan GPU global yang terbatas, kenaikan ini ditafsirkan sebagai sinyal ketidakseimbangan suplai dan permintaan
  • Selama 20 tahun AWS membentuk persepsi bahwa “harga selalu turun”, tetapi langkah kali ini meruntuhkan asumsi tersebut
  • Begitu harga dinaikkan sekali dan reaksi pasar tidak besar, peluang kenaikan tambahan akan semakin tinggi
  • Disebutkan pula kemungkinan penyesuaian serupa di layanan lain ke depan, seperti instance Graviton atau biaya transfer data
  • Artikel tersebut menyatakan bahwa “keyakinan bahwa harga cloud hanya bergerak ke satu arah lenyap pada hari Sabtu di Januari 2026

Kesimpulan

  • Kenaikan harga GPU kali ini dinilai sebagai titik balik dalam kebijakan harga AWS
  • Ini menjadi momen yang menggoyahkan kepercayaan terhadap stabilitas biaya di pasar cloud, dan
    memunculkan kemungkinan adanya kenaikan lanjutan pada resource yang pasokannya terbatas di masa depan

1 komentar

 
GN⁺ 2026-01-07
Pendapat Hacker News
  • Melihat harga GPU, RAM, dan hard disk semuanya naik, membuat orang membayangkan masa depan ketika komputer rumahan digantikan oleh thin client dan semua komputasi berpindah ke layanan berlangganan
    Slogan seperti ‘tidak perlu ruang penyimpanan, pakai langganan cloud’, ‘tidak perlu daya pemrosesan, streaming saja gamenya’ bisa jadi benar-benar menjadi kenyataan
    Perusahaan game pun sudah meninjau model penagihan per jam, sehingga struktur game seperti Call of Duty atau GTA bisa berubah total
    Media fisik bisa menghilang, kapasitas penyimpanan iPhone berkurang, dan semuanya dipaksa ke iCloud
    Ini juga memunculkan gambaran masyarakat yang beralih dari kepemilikan mobil ke berbagi kendaraan otonom, dan dari tutupnya toko fisik ke pengiriman berbasis drone

    • Harga layanan berlangganan juga ikut naik. Orang yang sudah membeli komputer mungkin masih bisa bertahan beberapa tahun, tetapi pengguna rental langsung terkena dampaknya
    • Jam alarm (Hatch.co) yang diterima sebagai hadiah Natal tidak berfungsi tanpa langganan 50 dolar per tahun. Konsumen perlu lebih memahami total cost of ownership (TCO). Mungkin pemerintah perlu mewajibkan stiker biaya tahunan seperti pada peralatan rumah tangga
    • Rantai pasok sangat rapuh, dan dengan TSMC memegang 60% pangsa pasar, jika Tiongkok menyerang Taiwan, lebih dari setengah produksi CPU dan GPU dunia bisa lenyap. Saat itu iPhone bisa berhenti dijual sama sekali, dan satu PC bisa berharga 5.000 dolar
    • MMORPG sudah lama memakai model langganan bulanan. Tetapi kebanyakan game justru tampaknya akan menghasilkan lebih sedikit uang jika beralih ke penagihan per jam. Orang membeli banyak game, tetapi pada kenyataannya hampir tidak memainkannya
    • Arus seperti ini sudah diteorikan dalam konsep yang disebut Technofeudalism (tautan Wikipedia)
  • Frasa “hopes you weren't paying attention” pada judul artikel terasa terlalu provokatif
    Ini tampak seperti mekanisme pasar biasa ketika permintaan GPU dan RAM melebihi pasokan

    • Ini gaya headline sensasional khas The Register. Tujuannya memang untuk memancing klik, dan kali ini jelas berhasil
    • Pasokan GPU dan RAM tidak berubah mendadak hanya karena akhir pekan. Tidak ada alasan khusus untuk menaikkan harga pada hari Sabtu
    • Mengumumkan kenaikan harga pada hari Sabtu, saat pelanggan tidak sedang bekerja, terasa janggal
    • Bahkan ekonomi tingkat SMA pun cukup untuk menunjukkan bahwa perusahaan-perusahaan seperti ini sejauh ini hanya menghasilkan utang dan produktivitas yang buruk
  • Terkait artikel tentang kenaikan harga AWS, menulis “akan diperbarui” tanpa menjelaskan arahnya, apakah naik atau turun, terasa membingungkan
    Orang yang sudah menjadi pelanggan tidak memeriksa halaman harga setiap hari, jadi pengumuman seperti ini pada dasarnya adalah komunikasi yang tidak transparan

    • Ada komentar yang menyindir cara AWS mengumumkan hal seperti ini dengan lelucon dari The Hitchhiker’s Guide to the Galaxy tentang “papan pengumumannya ada di dalam laci toilet yang terkunci”
  • Ada kritik soal memperpanjang periode depresiasi GPU dari 3 tahun menjadi 5 tahun, tetapi kenaikan harga kali ini justru tampak menunjukkan bahwa umur nilai GPU semakin panjang

    • Saya bukan ahli, tetapi kenaikan harga justru bisa menjadi sinyal bahwa umurnya memendek. Bisa jadi karena pasokan menurun atau permintaan naik. Bisa juga karena permintaan GPU menjadi inelastis, sehingga harga terus terdorong naik
    • Ini tergantung seberapa besar NVIDIA melebih-lebihkan peningkatan performa. Jika penambahan fitur RL, pemisahan prefill/decode, dan perbaikan struktural seperti nvfp4 benar-benar meningkatkan efisiensi, chip lama pun masih sangat berguna
    • GPU kelas atas memang bisa dipakai lebih dari 6 tahun. Dengan pendinginan yang baik, bahkan bisa mendekati 10 tahun. Terutama model dengan VRAM 80GB atau lebih punya nilai jangka panjang yang tinggi
  • AI cloud bagi kebanyakan perusahaan hanyalah pajak kenyamanan (convenience tax)
    Dokumen, prediksi, pemantauan, dukungan, dan sistem kontrol semuanya cukup bisa ditangani oleh model lokal. Jika mempertimbangkan data gravity, latensi, dan privasi, memiliki hardware edge lebih masuk akal

    • Saya juga sedang membuat prototipe LLM untuk berbagai penggunaan, dan masalah yang lebih besar daripada biaya adalah keandalan. Perbedaan antara 99,95% dan 99% bisa menimbulkan kerugian yang lebih besar daripada biaya tenaga kerja. Di area yang perhitungannya memungkinkan, saya masih merasa manusia lebih baik
  • Sepertinya seluruh industri AI akan segera terkena guncangan harga

    • Tim kami sama sekali tidak punya rencana jika biaya API dan infrastruktur melonjak. Saat ini kami memasukkan fitur AI yang nyaris gratis sebagai alat pemasaran, tetapi kalau biaya nyata mulai muncul, mungkin semuanya harus dicabut
    • Pada akhirnya, banyak penggunaan kemungkinan akan berpindah ke model open-weight buatan Tiongkok. Di luar model kelas tertinggi, untuk sebagian besar kebutuhan levelnya sudah cukup ‘good enough’
    • Guncangan ini tidak hanya akan berdampak pada industri AI, tetapi pada semua industri
    • Sebagai pengguna Claude, saya juga khawatir dengan kenaikan harga seperti ini
  • AI sedang menyedot semua sumber daya dan mencekik industri lain

    • Philip K. Dick dan Frank Herbert sudah dengan tepat meramalkan struktur kapitalisme yang tak berubah seperti ini
  • Penasaran apakah ada layanan yang melacak perubahan harga GPU per jam

    • Saya sudah setahun mengembangkan computeprices.com sebagai side project untuk itu
    • AWS yang menaikkan harga instance tertentu itu tidak lazim. Tetapi masalah yang lebih besar adalah ketidaktransparanan karena menaikkan harga tanpa pemberitahuan sebelumnya. Dari sudut pandang pelanggan, ini merusak kepercayaan
  • Senang melihat Corey Quinn muncul di The Register

  • Lonjakan belanja modal akibat pembelian GPU dalam jumlah besar mendorong naiknya permintaan komponen lain seperti memori
    Namun tetap muncul pertanyaan seberapa banyak GPU itu benar-benar digunakan. Ini membuat orang bertanya-tanya apakah kita sedang membayar untuk stok yang menganggur