- OpenAI, Anthropic, Google, dan lainnya menawarkan harga langganan yang lebih rendah daripada biaya penyediaan sebenarnya kepada perusahaan, sehingga bisa menimbulkan guncangan biaya besar saat harga disesuaikan
- Paket tetap bulanan $20 seperti Claude Pro dan ChatGPT Plus dapat setara dengan biaya API riil pengguna berat hingga $200–$400 per kursi per bulan
- AI agentic meningkatkan konsumsi token secara signifikan melalui eksekusi otonom berdurasi panjang, dan GitHub Copilot juga akan beralih ke penagihan berbasis penggunaan pada Juni 2026
- Biaya langganan bulanan $1.000 untuk tim 50 orang bisa setara dengan $15.000–$40.000 per bulan jika dihitung berdasarkan token aktual, sehingga eksposur anggaran membesar
- Persiapan IPO OpenAI dan Anthropic meningkatkan tekanan pada margin dan unit economics, yang dapat mempercepat kenaikan harga, pembatasan penggunaan, atau peralihan ke penagihan berbasis konsumsi
Kesenjangan antara harga langganan AI dan biaya sebenarnya
- Penyedia AI utama seperti OpenAI, Anthropic, dan Google memberikan layanan kepada pelanggan enterprise dengan harga langganan yang lebih rendah daripada biaya penyediaan sebenarnya, dan jika perusahaan menganggap harga ini sebagai patokan permanen lalu membangun alur kerja di atasnya, mereka bisa terkena guncangan biaya besar saat harga disesuaikan di masa depan
- Claude Pro seharga $20 per bulan menawarkan Sonnet 4.6, Opus 4.6, pencarian web, eksekusi kode, pembuatan file, dan sekitar 5x kuota penggunaan dibanding tier gratis
- Berdasarkan API, Sonnet 4.6 dikenai biaya $3 per 1 juta token input dan $15 per 1 juta token output, sedangkan Opus 4.6 dikenai biaya $5 per 1 juta token input dan $25 per 1 juta token output
- Jika seorang knowledge worker menggunakan Claude beberapa jam setiap hari untuk unggah dokumen, menulis laporan, dan analisis data, konsumsi token bisa mencapai jutaan token per minggu, yang bila dikonversi ke biaya API dapat naik ke kisaran $200–$400 per kursi per bulan
- Microsoft dilaporkan merugi lebih dari $20 per pengguna per bulan pada GitHub Copilot, dan biaya komputasi untuk pengguna berat pada langganan $10 per bulan dilaporkan bisa naik hingga $80
- Ada juga analisis yang menyebut pengguna Anthropic mengonsumsi komputasi lebih dari $8 untuk setiap $1 pendapatan langganan, dan VP produk OpenAI Nick Turley menggambarkan harga langganan sebagai struktur yang terbentuk secara kebetulan serta membandingkan kemungkinan penghapusan bertahap paket unlimited dengan penggunaan listrik tanpa batas
- ChatGPT Plus mempertahankan harga $20 per bulan selama 3 tahun, tetapi dalam periode itu fiturnya bertambah, termasuk pembuatan gambar, interpretasi kode, mode suara, penalaran agentic, dan pencarian web
Strategi harga bersama para penyedia utama
- Google menawarkan Gemini Advanced dalam paket Google One AI Premium seharga $20 per bulan, sambil tetap mengenakan biaya terpisah untuk akses API ke model yang sama
- Meta menyediakan Llama secara gratis dan mensubsidi biaya komputasi untuk ratusan juta kueri AI di platformnya sendiri dengan pendapatan iklan
- Grok dari xAI menetapkan harga input API rendah, yaitu $.20 per 1 juta token, dan diposisikan sebagai struktur yang rela menanggung kerugian demi merebut pangsa pasar
- Pola umumnya adalah menetapkan harga berdasarkan ekspansi adopsi, bukan keekonomian, mengunci organisasi, menjadikan AI sebagai elemen ketergantungan inti dalam pekerjaan harian tiap tim, lalu menunda persoalan biaya ke belakang
- OpenAI dilaporkan merugi pada langganan konsumen dan sedang mempertimbangkan pergeseran strategi untuk lebih fokus pada enterprise, tempat unit economics relatif tidak seburuk itu
- Menurut The Wall Street Journal, dalam proses menuju IPO, OpenAI gagal mencapai target pendapatan dan pengguna utama, dan sistem harga berbasis subsidi juga mulai menunjukkan retakan
AI agentic memperburuk struktur biaya
- Pada penggunaan chatbot, tanya-jawab menghasilkan konsumsi token yang relatif bisa diprediksi, tetapi AI agentic sangat meningkatkan penggunaan token melalui eksekusi otonom berdurasi panjang
- Sesi Claude Code dapat berjalan otonom dalam waktu lama dan mengonsumsi token jauh lebih cepat daripada penggunaan interaktif
- Sebagian pengguna melaporkan menghabiskan jendela batas kecepatan 5 jam hanya dalam 90 menit
- GitHub mengumumkan akan memindahkan Copilot ke penagihan berbasis penggunaan mulai 1 Juni 2026 karena model tarif tetap runtuh untuk beban kerja agentic
- GitHub menyatakan Copilot telah berkembang pesat dan penggunaan agentic "sedang menjadi default", sehingga kebutuhan komputasi dan inferensi ikut meningkat
- Sam Altman secara terbuka mengatakan OpenAI kini harus menjadi perusahaan AI inference, yang sejalan dengan konteks bahwa penggunaan agentic secara mendasar memerlukan model ekonomi yang berbeda
- Dalam tim engineering, Agent Teams yang menjalankan beberapa instance AI secara paralel untuk satu proyek sangat meningkatkan pembakaran biaya; bila developer menjalankan 3–4 coding agent sekaligus, penggunaan token bisa meningkat bukan hanya beberapa kali lipat dibanding percakapan biasa, tetapi hingga satu orde lebih besar
Eksposur biaya yang tidak diukur perusahaan
- Selama 2 tahun terakhir, banyak perusahaan telah mengintegrasikan langganan AI jauh ke dalam operasional, dengan tim marketing menulis copy lewat ChatGPT Plus, tim engineering menulis dan mereview kode lewat Claude Pro, serta tim riset, customer success, dan keuangan memakai AI untuk ringkasan dokumen, ringkasan tiket, dan pemodelan skenario
- Jika 50 orang menggunakan Claude Pro, biayanya saat ini adalah $1.000 per bulan, dan ChatGPT Plus juga berada di tingkat yang sama, sehingga AI terlihat seperti pos kecil dalam laporan laba rugi
- Namun, jika penggunaan API aktual tim yang sama dihitung berdasarkan konsumsi token, nilainya bisa menjadi $15.000–$40.000 per bulan tergantung intensitas penggunaan, sehingga berubah menjadi item biaya yang memerlukan kode anggaran tersendiri
- Saat harga disesuaikan, perusahaan yang menganggap AI $20 per bulan sebagai input murah permanen bisa menerima tagihan yang sebelumnya tidak ada dalam anggaran justru ketika AI sudah tertanam sangat dalam di alur kerja dan sulit dicabut
- Subsidi menciptakan ketergantungan, dan ketergantungan menjadi jebakan perusahaan yang membuat kenaikan harga sulit dihindari
- KPMG Q1 2026 AI Quarterly Pulse mencatat organisasi di AS memperkirakan pengeluaran AI rata-rata $207 juta dalam 12 bulan ke depan, hampir dua kali lipat dibanding periode yang sama tahun sebelumnya
- Menurut survei riset Goldman Sachs, banyak perusahaan besar sudah melampaui anggaran AI mereka dalam skala beberapa digit, dan pengeluaran AI bisa menyamai gaji engineer dalam waktu dekat
- Swami Chandrasekaran, kepala AI & Data Labs KPMG North America, mengatakan kepada Marketplace bahwa baru satu atau dua kuartal lalu, hampir tidak ada yang memedulikan biaya konsumsi LLM
- Ekonom University of Chicago Brian Jabarian, yang memberi nasihat pada transformasi AI perusahaan, mengatakan bahwa waktu datangnya tagihan sudah mendekat
IPO bisa memaksa penyesuaian harga
- OpenAI dan Anthropic sedang menyiapkan IPO, dan dalam proses ini tekanan untuk memperkecil kesenjangan antara harga langganan dan biaya sebenarnya bisa meningkat
- Anthropic dilaporkan telah melampaui pendapatan tahunan tersirat $30 miliar, naik dari $9 miliar pada akhir 2025
- OpenAI disebut berada pada laju pendapatan sekitar $25 miliar
- OpenAI diperkirakan akan membakar kas kumulatif $115 miliar hingga 2029, dan disebut telah berkomitmen pada belanja komputasi $665 miliar hingga 2030
- Oracle disebut menanggung utang $43 miliar dalam satu tahun fiskal untuk membangun data center bagi OpenAI
- Selama masih menjadi perusahaan privat yang membakar modal ventura, mereka dapat mensubsidi biaya inferensi, mengoperasikan model sambil merugi, dan mempertahankan paket $20 per bulan yang biaya penyediaannya melebihi $100
- Setelah IPO, pasar publik akan menuntut margin, analis akan menuntut unit economics, dan investor akan menuntut jalur profitabilitas yang tidak bergantung pada pendanaan tanpa batas
- Cara tercepat untuk menutup kesenjangan harga adalah kenaikan harga, pembatasan penggunaan, atau peralihan ke penagihan berbasis konsumsi, dan ketiganya dapat berdampak besar pada pelanggan enterprise saat ini
Sinyal penyesuaian harga yang sudah terlihat
Apa yang perlu dilakukan pemimpin perusahaan sekarang
- Perusahaan harus mengaudit konsumsi token aktual per tim, bukan sekadar menghitung jumlah kursi
- Mereka perlu memodelkan bagaimana biaya AI berubah dalam skenario biaya 2x, 5x, 10x dibanding harga saat ini
- Mereka harus membangun opsionalitas vendor di dalam stack agar perubahan harga dari satu penyedia tidak langsung merusak anggaran
- Mereka harus membahas kesenjangan biaya AI dengan CFO sebelum CFO yang lebih dulu mengangkat masalah itu
- Selisih antara jumlah yang dibayar organisasi untuk AI saat ini dan jumlah yang akan dibayar 18 bulan ke depan bisa menjadi salah satu kenaikan pos biaya terbesar yang harus diserap banyak perusahaan
- Bisa muncul perusahaan yang harus menjelaskan mengapa alat yang dulu lebih murah daripada makan siang tim tiba-tiba memerlukan anggaran tahunan enam digit
- Era subsidi sedang berakhir, dan banyak perusahaan bahkan belum mulai membicarakan hal ini
4 komentar
Sepertinya ini isu yang sama seperti pada era mainframe..
Jika terbentuk kondisi bahwa server mahal dan sumber daya terbatas, sementara komputer pribadi lambat,
pada akhirnya server juga akan menjadi lebih murah dan performa komputer pribadi juga meningkat... sepertinya waktu yang akan menjawab.
Kalau mahal, ya tidak usah dipakai..
Karena berpikir orang tetap akan memakainya meski mahal, para penyedia LLM kemungkinan menaikkan harga. Saya jadi penasaran bagaimana nasib LLM open source seperti GLM, qwen, dan deepseek ke depannya. Orang-orang akan mulai menghitung, apakah harus membayar harga ini untuk memakai model frontier, atau justru lebih masuk akal memakai open source meski harus bersusah payah membangun infrastruktur vLLM sendiri.
Komentar Hacker News
Semua langganan AI seperti bom waktu bagi penyedia model frontier
Dalam beberapa tahun, kita akan bisa menjalankan model lokal yang hampir tanpa biaya dan sebaik model frontier saat ini, dan fondasi pasar enterprise perusahaan frontier akan runtuh
Hanya dari kebutuhan memori saja sudah sangat besar, dan untuk beberapa waktu ke depan akan jauh lebih efisien dari sisi biaya untuk memakai perangkat keras hosting khusus bersama dengan utilisasi tinggi
Mereka harus terus menjadi lebih baik agar tetap unggul satu sama lain dan juga dari model open-weight, jadi justru lebih dekat ke kebalikan dari bom waktu
Token inferensi pada tingkat kemampuan saat ini akan terus menjadi lebih murah, dan saya tidak tahu apakah lokal akan menjadi keadaan akhir karena tuntutan perangkat kerasnya tinggi, tetapi persaingan cenderung mendorong margin laba mendekati nol
Diskusi panjang tentang topik ini: https://corecursive.com/the-pre-training-wall-and-the-treadm...
Saya memantau penggunaan token, dan sedang bergerak agresif untuk menurunkan biaya inferensi dan menginternalisasikannya alih-alih membakar token secara bodoh
Atasan saya sangat puas, dan sekarang kami sedang menggulirkannya lebih luas. Saya rasa inilah masa depannya
Scaling law sendiri sudah makin berat, dan kita tidak boleh termakan hiperbola “eksponensial”
Selain itu, pesaing yang sebenarnya adalah model frontier dua tahun dari sekarang
Dibanding 1~2 tahun lalu, sekarang dibutuhkan perangkat keras yang lebih besar, lebih mahal, dan lebih boros energi
Nada yang terlalu bombastis dari tulisan kubu AI mana pun sangat melelahkan
Saya ingin berdiri di depan whiteboard dengan seseorang yang benar-benar paham ekonomi dan bisnis penyedia token lalu bertanya dengan gaya “jelaskan seperti ke anak lima tahun”
Apakah ini permainan margin bagi penyedia token dan permainan kualitas layanan/produk bagi konsumen, dan jika garis antara kualitas dan margin suatu hari berpotongan, apakah ini perlombaan untuk sampai ke titik itu sebelum uang habis? Jika ya, adakah contoh historis di mana jarak antara keduanya sangat besar?
LLM terasa unik karena secara praktis tidak ada batas atas atas seberapa jauh konsumen “mengharapkan menjadi lebih baik”, dan berbeda dari layanan seperti email yang mudah diskalakan dari sudut pandang sumber daya komputasi
Ini pertanyaan yang sangat dasar, tetapi saya juga penasaran mengapa mereka ingin IPO sebelum ada model bisnis yang berkelanjutan. Apa keuntungannya?
Menurut tautan-tautan yang diposting di sini, sekitar 30% pengeluaran Anthropic adalah untuk inferensi, dan 70% sisanya adalah litbang seperti pengembangan model berikutnya
Jika ini diperhitungkan dan ditambah laba lalu angkanya disederhanakan, untuk menghasilkan uang mereka cukup menjualnya sekitar 1 dolar per 1 juta token
Harga API saat ini adalah 25 dolar per 1 juta token, jadi saya tidak ragu ada profitabilitas
Sebaliknya, jika paket Max 200 dolar per bulan dipakai secara ekstrem sampai 10 miliar token per bulan, itu berarti 0,02 dolar per 1 juta token, jadi mereka menanggung kerugian besar dan ini suatu saat akan hilang
Namun, jika seseorang memakai 100 juta token per bulan pada paket Anthropic 100 dolar per bulan, perusahaan tetap menghasilkan uang
Untuk memakai 10 miliar token per bulan, seseorang harus bekerja sangat lama dan benar-benar mahir memanfaatkan AI, dan orang seperti itu kemungkinan sudah memakai AI selama beberapa tahun dan bahkan sebelum Opus pun sudah merasa terbantu
Mereka mungkin kecewa jika kehilangan Opus, tetapi justru pengguna seperti itulah tipe yang juga bisa memanfaatkan model yang lebih lemah dengan baik, jadi beberapa tahun lagi mereka bisa pindah ke model open-source yang di-host internal dan tetap mendapatkan kisaran 0,02 dolar per 1 juta token seperti sekarang
Jadi saya tidak terlalu yakin dengan nuansa pesimistis tulisan itu. Situasinya akan berubah, tetapi itu tidak berarti akhir dari penggunaan AI
Saya setuju dengan nuansa tulisannya, tetapi gaya penulisannya terasa terlalu mirip LLM
Terutama struktur bagian-bagiannya dan punchline seperti “That is not a rounding error. That is a line item that needs its own budget code.”
Cukup menjengkelkan, dan dengan prompt yang sama saya jarang melihat Gemini melakukannya
Tidak ada nama penulis di artikelnya
Brad Gerstner sudah mengonfirmasi bahwa token tidak dijual rugi
Terlepas dari bagaimana rumusnya membagi antara API dan langganan, perusahaan-perusahaan ini untung jika dilihat murni dari penjualan token
Kalau memasukkan gaji dan kompensasi saham mungkin rugi, tetapi token itu sendiri saat ini menguntungkan
Itu mungkin benar saat ini, tetapi bukan begitu cara sampai ke sini
Investasi yang harus dipulihkan bernilai triliunan dolar sementara pendapatannya paling banter miliaran dolar, jadi hitungan bahwa token akan segera menghasilkan laba tidak masuk akal
Inferensi tidak bisa dianggap cukup hanya karena secara terpisah menguntungkan; ia juga harus menanggung biaya itu
[0] https://epoch.ai/data-insights/openai-compute-spend
Kerugian itu ditambal lewat struktur pembiayaan bergulir yang aneh, dan suatu saat besar kemungkinan akan runtuh menjadi krisis utang
Saya rasa yang itu disubsidi besar-besaran, tetapi hanya itulah yang benar-benar saya rasakan nilainya
Masalah dengan keseluruhan “AI” adalah hidup tanpa itu ternyata mudah
Perusahaan AI tahu, pengguna tahu, bahkan manajer yang paling pro agen AI pun tahu
Bayangkan kalau semua AI di dunia dihapus sekarang juga, hasilnya ya cuma pekerjaan seperti biasa
Tulisan ini tidak cukup menekankan hal itu. Apakah maksudnya takut pada hari ketika review PR harus kembali dilakukan oleh engineer sungguhan?
Semakin dalam teknologinya terintegrasi, semakin tidak benar pernyataan itu
Dalam beberapa tahun setelah motor listrik muncul, Anda juga bisa mengatakan hal yang sama dan cukup kembali ke tenaga uap
Tetapi kalau sekarang mencoba hidup tanpa motor listrik, masyarakat akan runtuh
Pertanyaannya bukan apakah saat ini kita bisa hidup tanpa itu, melainkan apakah 5~10 tahun ke depan, setelah terintegrasi penuh, kita masih bisa hidup tanpa itu
Bukan untuk menciptakan pendapatan yang jujur, melainkan untuk menanamkan produk AI begitu dalam sampai “ya sudah, cabut saja AI-nya” tidak lagi terlihat sebagai pilihan
Bahkan kalau biaya pemeliharaannya terus naik sampai melewati level bailout pemerintah ala maskapai sekalipun
Ini adalah lapisan perantara ekstraksi kekayaan baru yang dijual dengan janji palsu
Setidaknya untuk menulis JavaScript, saya merasa tidak bisa hidup tanpa AI
Seolah-olah AI diperlakukan seperti hewan peliharaan yang akan mati kalau tidak sesekali dipakai
Tulisan ini salah. Langganan seperti itu bukannya tidak ditawarkan ke enterprise
Perusahaan membayar angka yang jauh lebih dekat ke harga API
Strateginya adalah membuat orang terbiasa dengan token tanpa batas di langganan pribadi, lalu berharap perilaku itu terbawa ke tempat kerja
Seat tim atau enterprise memang lebih mahal daripada harga konsumen, tetapi tetap harga tetap dengan batas penggunaan yang di-reset
Anda bisa menetapkan seat yang setara dengan paket 20/100/200 dolar per bulan ke anggota, atau semuanya berbasis penggunaan
Ada berbagai cara untuk membelinya
Bahkan ada paket berbasis penggunaan yang setara dengan paket konsumen yang sama
Perusahaan tempat saya bekerja ditagih berdasarkan penggunaan API
“Secara umum polanya sama. Penetapan harga untuk adopsi, bukan untuk unit economics. Mengunci organisasi. Menjadikan AI bagian yang menanggung beban dalam pekerjaan sehari-hari setiap tim. Urusan tagihan dipikirkan belakangan.”
10 ribu dolar per bulan bukanlah nol, tetapi jika dengan uang itu Anda mendukung tim beranggotakan 10~20 engineer, itu leverage yang cukup bagus
Saya tidak membaca seluruh tulisan aslinya sampai habis, tetapi saya bisa tahu itu ditulis AI
Mungkin OpenRouter bisa dipakai sebagai tolok ukur biaya dasar penyedia AI
Saya terus mendengar bahwa nilainya lebih baik daripada Claude, jadi kalau begitu kelihatannya Anthropic entah memang sangat tidak efisien atau memang mengambil untung dari inferensi
Mereka mungkin rugi di pelatihan, tetapi itu kemungkinan adalah biaya untuk tetap menjadi lab terdepan
Kalau ada satu perusahaan yang tumbang karena utang dan sebagainya, bukankah enterprise tinggal pindah saja?
Kalau saya melihat satu kali lagi frasa seperti “It’s not X. It’s Y.” atau penggunaan “load-bearing” sebagai metafora, saya bisa muntah
“Era subsidi tidak berakhir dengan anggun. Ia memperlihatkan retak di mana-mana.”
“Pertanyaannya bukan apakah itu pernah menjadi kesepakatan yang bagus. Pertanyaannya adalah berapa lama kesepakatan itu bisa bertahan.”
“Pengembang yang menjalankan tiga atau empat coding agent sekaligus tidak memakai token 3 atau 4 kali lebih banyak daripada percakapan chat. Bukan beda satu digit; itu lebih dari satu orde besaran.”
“Ini bukan lagi eksperimen. Ini adalah workflow yang menanggung beban.”
“Itu bukan error pembulatan. Itu pos anggaran yang butuh kode anggaran sendiri.”
Setidaknya kita boleh berharap begitu
Ada data dan logikanya terdengar masuk akal, tetapi begitu masuk pertengahan langsung muncul contoh tren, contoh lain, contoh ketiga, lalu “itu bukan sekadar X melainkan Y”
Rasanya semenyebalkan membaca tulisan bagus lalu mengklik tautan sumber dan ternyata kena rickroll
Pelanggan enterprise tidak memakai langganan Claude Pro 20 dolar per bulan
Perusahaan kami memberi developer batas penggunaan sekitar 1.000 dolar per bulan, dan menurut saya penghematannya dibanding biaya API paling besar sekitar 30%
Itu bukan tingkat subsidi yang gila
Untuk jabatan lain sering kali hanya diberi 50 dolar per bulan, dan mereka terus menghabiskan batas itu
GitHub Copilot sudah lama memakai pendekatan seperti ini untuk seat bisnis dan enterprise, tetapi akan segera menabrak batas
Setelah Juni, ketika akun Pro dan Pro+ konsumen dirapikan ulang, saya rasa mereka akan cepat menyusul
OpenAI tampaknya sedang menghamburkan token untuk mengunci pelanggan, jadi setelah IPO saya paling khawatir pada perubahan harga dan syarat yang mendadak dari OpenAI
Anthropic sudah bertindak lebih bertanggung jawab di bagian ini, dan GitHub Copilot juga tampaknya sedang berusaha memperbaiki subsidi berlebihan dalam beberapa bulan ke depan
Itu karena penagihannya berdasarkan “request”, bukan token
Satu request senilai 3 sen bisa saja membakar token senilai lebih dari 20 dolar, dan model itu berakhir bulan ini
Saya juga khawatir karena selama ini memproses pekerjaan besar dengan GHCP, tetapi setelah melihat estimator tagihan baru, ternyata dengan harga API itu sekitar 150~200 dolar per bulan
Itu tetap subsidi untuk langganan 20 dolar per bulan, tetapi bukan tingkat yang gila
Jika alat coding bergaya agent dipakai secara intens namun bertanggung jawab, kemungkinan biayanya akan berada di kisaran 200 dolar per bulan menurut harga API
Jika penyedia masih bisa untung pada harga itu, bagi perusahaan di Barat yang mempekerjakan developer, itu bukan angka yang sulit diterima jika mempertimbangkan waktu yang dihemat
Risiko sebenarnya ada pada vibe coder yang mengerjakan proyek pribadi
Era menyalahgunakan paket bersubsidi untuk membuat aplikasi raksasa sedang berakhir
Jika memang menggantikan developer, harga yang lebih mahal daripada 20 atau 100 dolar per bulan masuk akal
Masalah sebenarnya perusahaan LLM adalah mereka belum bisa menunjukkan nilai di area selain coding
Tanpa itu, mereka hanya akan turun derajat menjadi alat coding
Karena itulah mereka terburu-buru sekarang, dan yang penting adalah workflow pekerjaan apa lagi yang bisa diotomatisasi
Pekerjaan administratif mungkin semuanya bisa diotomatisasi
Jika area lain berkembang, mereka akan mengubah model harga
Itu mungkin bisa bernilai juga