Langganan AI adalah bom waktu bagi enterprise

(thestateofbrand.com)

7 poin oleh GN⁺ 2026-05-18 | 7 komentar | Bagikan ke WhatsApp

OpenAI, Anthropic, Google, dan lainnya menawarkan harga langganan yang lebih rendah daripada biaya penyediaan sebenarnya kepada perusahaan, sehingga bisa menimbulkan guncangan biaya besar saat harga disesuaikan
Paket tetap bulanan $20 seperti Claude Pro dan ChatGPT Plus dapat setara dengan biaya API riil pengguna berat hingga $200–$400 per kursi per bulan
AI agentic meningkatkan konsumsi token secara signifikan melalui eksekusi otonom berdurasi panjang, dan GitHub Copilot juga akan beralih ke penagihan berbasis penggunaan pada Juni 2026
Biaya langganan bulanan $1.000 untuk tim 50 orang bisa setara dengan $15.000–$40.000 per bulan jika dihitung berdasarkan token aktual, sehingga eksposur anggaran membesar
Persiapan IPO OpenAI dan Anthropic meningkatkan tekanan pada margin dan unit economics, yang dapat mempercepat kenaikan harga, pembatasan penggunaan, atau peralihan ke penagihan berbasis konsumsi

Kesenjangan antara harga langganan AI dan biaya sebenarnya

Penyedia AI utama seperti OpenAI, Anthropic, dan Google memberikan layanan kepada pelanggan enterprise dengan harga langganan yang lebih rendah daripada biaya penyediaan sebenarnya, dan jika perusahaan menganggap harga ini sebagai patokan permanen lalu membangun alur kerja di atasnya, mereka bisa terkena guncangan biaya besar saat harga disesuaikan di masa depan
Claude Pro seharga $20 per bulan menawarkan Sonnet 4.6, Opus 4.6, pencarian web, eksekusi kode, pembuatan file, dan sekitar 5x kuota penggunaan dibanding tier gratis
Berdasarkan API, Sonnet 4.6 dikenai biaya $3 per 1 juta token input dan $15 per 1 juta token output, sedangkan Opus 4.6 dikenai biaya $5 per 1 juta token input dan $25 per 1 juta token output
Jika seorang knowledge worker menggunakan Claude beberapa jam setiap hari untuk unggah dokumen, menulis laporan, dan analisis data, konsumsi token bisa mencapai jutaan token per minggu, yang bila dikonversi ke biaya API dapat naik ke kisaran $200–$400 per kursi per bulan
Microsoft dilaporkan merugi lebih dari $20 per pengguna per bulan pada GitHub Copilot, dan biaya komputasi untuk pengguna berat pada langganan $10 per bulan dilaporkan bisa naik hingga $80
Ada juga analisis yang menyebut pengguna Anthropic mengonsumsi komputasi lebih dari $8 untuk setiap $1 pendapatan langganan, dan VP produk OpenAI Nick Turley menggambarkan harga langganan sebagai struktur yang terbentuk secara kebetulan serta membandingkan kemungkinan penghapusan bertahap paket unlimited dengan penggunaan listrik tanpa batas
ChatGPT Plus mempertahankan harga $20 per bulan selama 3 tahun, tetapi dalam periode itu fiturnya bertambah, termasuk pembuatan gambar, interpretasi kode, mode suara, penalaran agentic, dan pencarian web

Strategi harga bersama para penyedia utama

Google menawarkan Gemini Advanced dalam paket Google One AI Premium seharga $20 per bulan, sambil tetap mengenakan biaya terpisah untuk akses API ke model yang sama
Meta menyediakan Llama secara gratis dan mensubsidi biaya komputasi untuk ratusan juta kueri AI di platformnya sendiri dengan pendapatan iklan
Grok dari xAI menetapkan harga input API rendah, yaitu $.20 per 1 juta token, dan diposisikan sebagai struktur yang rela menanggung kerugian demi merebut pangsa pasar
Pola umumnya adalah menetapkan harga berdasarkan ekspansi adopsi, bukan keekonomian, mengunci organisasi, menjadikan AI sebagai elemen ketergantungan inti dalam pekerjaan harian tiap tim, lalu menunda persoalan biaya ke belakang
OpenAI dilaporkan merugi pada langganan konsumen dan sedang mempertimbangkan pergeseran strategi untuk lebih fokus pada enterprise, tempat unit economics relatif tidak seburuk itu
Menurut The Wall Street Journal, dalam proses menuju IPO, OpenAI gagal mencapai target pendapatan dan pengguna utama, dan sistem harga berbasis subsidi juga mulai menunjukkan retakan

AI agentic memperburuk struktur biaya

Pada penggunaan chatbot, tanya-jawab menghasilkan konsumsi token yang relatif bisa diprediksi, tetapi AI agentic sangat meningkatkan penggunaan token melalui eksekusi otonom berdurasi panjang
Sesi Claude Code dapat berjalan otonom dalam waktu lama dan mengonsumsi token jauh lebih cepat daripada penggunaan interaktif
Sebagian pengguna melaporkan menghabiskan jendela batas kecepatan 5 jam hanya dalam 90 menit
GitHub mengumumkan akan memindahkan Copilot ke penagihan berbasis penggunaan mulai 1 Juni 2026 karena model tarif tetap runtuh untuk beban kerja agentic
GitHub menyatakan Copilot telah berkembang pesat dan penggunaan agentic "sedang menjadi default", sehingga kebutuhan komputasi dan inferensi ikut meningkat
Sam Altman secara terbuka mengatakan OpenAI kini harus menjadi perusahaan AI inference, yang sejalan dengan konteks bahwa penggunaan agentic secara mendasar memerlukan model ekonomi yang berbeda
Dalam tim engineering, Agent Teams yang menjalankan beberapa instance AI secara paralel untuk satu proyek sangat meningkatkan pembakaran biaya; bila developer menjalankan 3–4 coding agent sekaligus, penggunaan token bisa meningkat bukan hanya beberapa kali lipat dibanding percakapan biasa, tetapi hingga satu orde lebih besar

Eksposur biaya yang tidak diukur perusahaan

Selama 2 tahun terakhir, banyak perusahaan telah mengintegrasikan langganan AI jauh ke dalam operasional, dengan tim marketing menulis copy lewat ChatGPT Plus, tim engineering menulis dan mereview kode lewat Claude Pro, serta tim riset, customer success, dan keuangan memakai AI untuk ringkasan dokumen, ringkasan tiket, dan pemodelan skenario
Jika 50 orang menggunakan Claude Pro, biayanya saat ini adalah $1.000 per bulan, dan ChatGPT Plus juga berada di tingkat yang sama, sehingga AI terlihat seperti pos kecil dalam laporan laba rugi
Namun, jika penggunaan API aktual tim yang sama dihitung berdasarkan konsumsi token, nilainya bisa menjadi $15.000–$40.000 per bulan tergantung intensitas penggunaan, sehingga berubah menjadi item biaya yang memerlukan kode anggaran tersendiri
Saat harga disesuaikan, perusahaan yang menganggap AI $20 per bulan sebagai input murah permanen bisa menerima tagihan yang sebelumnya tidak ada dalam anggaran justru ketika AI sudah tertanam sangat dalam di alur kerja dan sulit dicabut
Subsidi menciptakan ketergantungan, dan ketergantungan menjadi jebakan perusahaan yang membuat kenaikan harga sulit dihindari
KPMG Q1 2026 AI Quarterly Pulse mencatat organisasi di AS memperkirakan pengeluaran AI rata-rata $207 juta dalam 12 bulan ke depan, hampir dua kali lipat dibanding periode yang sama tahun sebelumnya
Menurut survei riset Goldman Sachs, banyak perusahaan besar sudah melampaui anggaran AI mereka dalam skala beberapa digit, dan pengeluaran AI bisa menyamai gaji engineer dalam waktu dekat
Swami Chandrasekaran, kepala AI & Data Labs KPMG North America, mengatakan kepada Marketplace bahwa baru satu atau dua kuartal lalu, hampir tidak ada yang memedulikan biaya konsumsi LLM
Ekonom University of Chicago Brian Jabarian, yang memberi nasihat pada transformasi AI perusahaan, mengatakan bahwa waktu datangnya tagihan sudah mendekat

IPO bisa memaksa penyesuaian harga

OpenAI dan Anthropic sedang menyiapkan IPO, dan dalam proses ini tekanan untuk memperkecil kesenjangan antara harga langganan dan biaya sebenarnya bisa meningkat
Anthropic dilaporkan telah melampaui pendapatan tahunan tersirat $30 miliar, naik dari $9 miliar pada akhir 2025
OpenAI disebut berada pada laju pendapatan sekitar $25 miliar
OpenAI diperkirakan akan membakar kas kumulatif $115 miliar hingga 2029, dan disebut telah berkomitmen pada belanja komputasi $665 miliar hingga 2030
Oracle disebut menanggung utang $43 miliar dalam satu tahun fiskal untuk membangun data center bagi OpenAI
Selama masih menjadi perusahaan privat yang membakar modal ventura, mereka dapat mensubsidi biaya inferensi, mengoperasikan model sambil merugi, dan mempertahankan paket $20 per bulan yang biaya penyediaannya melebihi $100
Setelah IPO, pasar publik akan menuntut margin, analis akan menuntut unit economics, dan investor akan menuntut jalur profitabilitas yang tidak bergantung pada pendanaan tanpa batas
Cara tercepat untuk menutup kesenjangan harga adalah kenaikan harga, pembatasan penggunaan, atau peralihan ke penagihan berbasis konsumsi, dan ketiganya dapat berdampak besar pada pelanggan enterprise saat ini

Sinyal penyesuaian harga yang sudah terlihat

GitHub akan beralih ke penagihan berbasis penggunaan pada 1 Juni 2026, menggantikan permintaan premium bertarif tetap dengan AI Credits berbasis token
Microsoft telah menaikkan harga Microsoft 365 dua kali dalam 4 tahun, dan kenaikan terbaru terhubung langsung dengan biaya infrastruktur AI
OpenAI memperkenalkan tier Pro $100 sebagai harga baru yang lebih mencerminkan biaya nyata untuk pengguna berat
Tier Max $200 per bulan dari Anthropic menjadi contoh seberapa besar biaya penggunaan pasti yang sebenarnya bisa muncul ketika subsidi berakhir
Geoff Webb, VP di Conga, mengatakan bahwa skala persaingan untuk mendominasi pasar AI sangat besar, dan biaya untuk menguasainya juga sangat besar, sehingga sangat mungkin akan terjadi perubahan besar yang cepat pada model bisnis dan harga layanan selama proses monetisasi dan pengembalian investasi

Apa yang perlu dilakukan pemimpin perusahaan sekarang

Perusahaan harus mengaudit konsumsi token aktual per tim, bukan sekadar menghitung jumlah kursi
Mereka perlu memodelkan bagaimana biaya AI berubah dalam skenario biaya 2x, 5x, 10x dibanding harga saat ini
Mereka harus membangun opsionalitas vendor di dalam stack agar perubahan harga dari satu penyedia tidak langsung merusak anggaran
Mereka harus membahas kesenjangan biaya AI dengan CFO sebelum CFO yang lebih dulu mengangkat masalah itu
Selisih antara jumlah yang dibayar organisasi untuk AI saat ini dan jumlah yang akan dibayar 18 bulan ke depan bisa menjadi salah satu kenaikan pos biaya terbesar yang harus diserap banyak perusahaan
Bisa muncul perusahaan yang harus menjelaskan mengapa alat yang dulu lebih murah daripada makan siang tim tiba-tiba memerlukan anggaran tahunan enam digit
Era subsidi sedang berakhir, dan banyak perusahaan bahkan belum mulai membicarakan hal ini

7 komentar

hmmhmmhm 2026-05-18

Sepertinya ini isu yang sama seperti pada era mainframe..
Jika terbentuk kondisi bahwa server mahal dan sumber daya terbatas, sementara komputer pribadi lambat,
pada akhirnya server juga akan menjadi lebih murah dan performa komputer pribadi juga meningkat... sepertinya waktu yang akan menjawab.

GN⁺ 2026-05-18

Komentar Hacker News

Semua langganan AI seperti bom waktu bagi penyedia model frontier
Dalam beberapa tahun, kita akan bisa menjalankan model lokal yang hampir tanpa biaya dan sebaik model frontier saat ini, dan fondasi pasar enterprise perusahaan frontier akan runtuh
- Saya tidak tahu dasar dari klaim bahwa “dalam beberapa tahun kita akan menjalankan model lokal yang sebaik model frontier saat ini”
  Hanya dari kebutuhan memori saja sudah sangat besar, dan untuk beberapa waktu ke depan akan jauh lebih efisien dari sisi biaya untuk memakai perangkat keras hosting khusus bersama dengan utilisasi tinggi
- Dengan kata lain, model frontier adalah aset yang nilainya turun sangat cepat karena persaingan pasar
  Mereka harus terus menjadi lebih baik agar tetap unggul satu sama lain dan juga dari model open-weight, jadi justru lebih dekat ke kebalikan dari bom waktu
  Token inferensi pada tingkat kemampuan saat ini akan terus menjadi lebih murah, dan saya tidak tahu apakah lokal akan menjadi keadaan akhir karena tuntutan perangkat kerasnya tinggi, tetapi persaingan cenderung mendorong margin laba mendekati nol
  Diskusi panjang tentang topik ini: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- Selama sebulan terakhir saya memasang Qwen, Gemma, dan Deepseek di belakang LiteLLM lalu membuat demo kecil untuk menunjukkan seperti apa masa depan itu
  Saya memantau penggunaan token, dan sedang bergerak agresif untuk menurunkan biaya inferensi dan menginternalisasikannya alih-alih membakar token secara bodoh
  Atasan saya sangat puas, dan sekarang kami sedang menggulirkannya lebih luas. Saya rasa inilah masa depannya
- Pernyataan bahwa dalam beberapa tahun kita akan menjalankan model lokal yang sebaik model frontier saat ini sangat meragukan
  Scaling law sendiri sudah makin berat, dan kita tidak boleh termakan hiperbola “eksponensial”
  Selain itu, pesaing yang sebenarnya adalah model frontier dua tahun dari sekarang
- Kecuali ada terobosan penting dalam produksi perangkat keras atau arsitektur model, justru yang terjadi kebalikannya
  Dibanding 1~2 tahun lalu, sekarang dibutuhkan perangkat keras yang lebih besar, lebih mahal, dan lebih boros energi
Nada yang terlalu bombastis dari tulisan kubu AI mana pun sangat melelahkan
Saya ingin berdiri di depan whiteboard dengan seseorang yang benar-benar paham ekonomi dan bisnis penyedia token lalu bertanya dengan gaya “jelaskan seperti ke anak lima tahun”
Apakah ini permainan margin bagi penyedia token dan permainan kualitas layanan/produk bagi konsumen, dan jika garis antara kualitas dan margin suatu hari berpotongan, apakah ini perlombaan untuk sampai ke titik itu sebelum uang habis? Jika ya, adakah contoh historis di mana jarak antara keduanya sangat besar?
LLM terasa unik karena secara praktis tidak ada batas atas atas seberapa jauh konsumen “mengharapkan menjadi lebih baik”, dan berbeda dari layanan seperti email yang mudah diskalakan dari sudut pandang sumber daya komputasi
Ini pertanyaan yang sangat dasar, tetapi saya juga penasaran mengapa mereka ingin IPO sebelum ada model bisnis yang berkelanjutan. Apa keuntungannya?
- Ketika saya bertanya ke AI tentang biaya produksi token Opus, jawabannya adalah 0,216 dolar per 1 juta token termasuk perangkat keras, listrik, pendinginan, dan hosting
  Menurut tautan-tautan yang diposting di sini, sekitar 30% pengeluaran Anthropic adalah untuk inferensi, dan 70% sisanya adalah litbang seperti pengembangan model berikutnya
  Jika ini diperhitungkan dan ditambah laba lalu angkanya disederhanakan, untuk menghasilkan uang mereka cukup menjualnya sekitar 1 dolar per 1 juta token
  Harga API saat ini adalah 25 dolar per 1 juta token, jadi saya tidak ragu ada profitabilitas
  Sebaliknya, jika paket Max 200 dolar per bulan dipakai secara ekstrem sampai 10 miliar token per bulan, itu berarti 0,02 dolar per 1 juta token, jadi mereka menanggung kerugian besar dan ini suatu saat akan hilang
  Namun, jika seseorang memakai 100 juta token per bulan pada paket Anthropic 100 dolar per bulan, perusahaan tetap menghasilkan uang
  Untuk memakai 10 miliar token per bulan, seseorang harus bekerja sangat lama dan benar-benar mahir memanfaatkan AI, dan orang seperti itu kemungkinan sudah memakai AI selama beberapa tahun dan bahkan sebelum Opus pun sudah merasa terbantu
  Mereka mungkin kecewa jika kehilangan Opus, tetapi justru pengguna seperti itulah tipe yang juga bisa memanfaatkan model yang lebih lemah dengan baik, jadi beberapa tahun lagi mereka bisa pindah ke model open-source yang di-host internal dan tetap mendapatkan kisaran 0,02 dolar per 1 juta token seperti sekarang
  Jadi saya tidak terlalu yakin dengan nuansa pesimistis tulisan itu. Situasinya akan berubah, tetapi itu tidak berarti akhir dari penggunaan AI
Saya setuju dengan nuansa tulisannya, tetapi gaya penulisannya terasa terlalu mirip LLM
Terutama struktur bagian-bagiannya dan punchline seperti “That is not a rounding error. That is a line item that needs its own budget code.”
- Claude benar-benar sangat sering menghasilkan kalimat seperti itu
  Cukup menjengkelkan, dan dengan prompt yang sama saya jarang melihat Gemini melakukannya
- Dari awal saya juga tidak tahu sebenarnya tulisan ini ditulis siapa
  Tidak ada nama penulis di artikelnya
- Pangram menandai tulisan ini sebagai 100% buatan AI dengan tingkat keyakinan tinggi
Brad Gerstner sudah mengonfirmasi bahwa token tidak dijual rugi
Terlepas dari bagaimana rumusnya membagi antara API dan langganan, perusahaan-perusahaan ini untung jika dilihat murni dari penjualan token
Kalau memasukkan gaji dan kompensasi saham mungkin rugi, tetapi token itu sendiri saat ini menguntungkan
- Rasanya seperti melihat roket dengan mesin paling kuat di bumi keluar dari orbit, lalu mematikan mesinnya dan berkata “sekarang dia terbang tanpa tenaga”
  Itu mungkin benar saat ini, tetapi bukan begitu cara sampai ke sini
  Investasi yang harus dipulihkan bernilai triliunan dolar sementara pendapatannya paling banter miliaran dolar, jadi hitungan bahwa token akan segera menghasilkan laba tidak masuk akal
- Token mungkin dijual dengan margin, tetapi 70% pengeluaran komputasi masuk ke litbang dan pelatihan model[0]
  Inferensi tidak bisa dianggap cukup hanya karena secara terpisah menguntungkan; ia juga harus menanggung biaya itu
  [0] https://epoch.ai/data-insights/openai-compute-spend
- Memang tidak dijual rugi, tetapi juga belum dijual cukup mahal untuk menutup kerugian dan biaya saat ini
  Kerugian itu ditambal lewat struktur pembiayaan bergulir yang aneh, dan suatu saat besar kemungkinan akan runtuh menjadi krisis utang
- Dengan kata lain, perusahaan AI memiliki laba positif sebelum biaya-biaya itu dikurangkan
- Saya tidak tahu apakah itu juga berlaku untuk token Claude Code atau Codex
  Saya rasa yang itu disubsidi besar-besaran, tetapi hanya itulah yang benar-benar saya rasakan nilainya
Masalah dengan keseluruhan “AI” adalah hidup tanpa itu ternyata mudah
Perusahaan AI tahu, pengguna tahu, bahkan manajer yang paling pro agen AI pun tahu
Bayangkan kalau semua AI di dunia dihapus sekarang juga, hasilnya ya cuma pekerjaan seperti biasa
Tulisan ini tidak cukup menekankan hal itu. Apakah maksudnya takut pada hari ketika review PR harus kembali dilakukan oleh engineer sungguhan?
- Bukankah pada tahap awal adopsi teknologi baru memang selalu begitu?
  Semakin dalam teknologinya terintegrasi, semakin tidak benar pernyataan itu
  Dalam beberapa tahun setelah motor listrik muncul, Anda juga bisa mengatakan hal yang sama dan cukup kembali ke tenaga uap
  Tetapi kalau sekarang mencoba hidup tanpa motor listrik, masyarakat akan runtuh
  Pertanyaannya bukan apakah saat ini kita bisa hidup tanpa itu, melainkan apakah 5~10 tahun ke depan, setelah terintegrasi penuh, kita masih bisa hidup tanpa itu
- Karena itu mungkin mereka justru mendorongnya lebih keras
  Bukan untuk menciptakan pendapatan yang jujur, melainkan untuk menanamkan produk AI begitu dalam sampai “ya sudah, cabut saja AI-nya” tidak lagi terlihat sebagai pilihan
  Bahkan kalau biaya pemeliharaannya terus naik sampai melewati level bailout pemerintah ala maskapai sekalipun
  Ini adalah lapisan perantara ekstraksi kekayaan baru yang dijual dengan janji palsu
- Kalau Anda memakai JavaScript, ya tentu begitu
  Setidaknya untuk menulis JavaScript, saya merasa tidak bisa hidup tanpa AI
- Rasanya selalu aneh melihat orang menganjurkan memakai alat AI bahkan untuk tugas yang sangat biasa dan umum
  Seolah-olah AI diperlakukan seperti hewan peliharaan yang akan mati kalau tidak sesekali dipakai
Tulisan ini salah. Langganan seperti itu bukannya tidak ditawarkan ke enterprise
Perusahaan membayar angka yang jauh lebih dekat ke harga API
Strateginya adalah membuat orang terbiasa dengan token tanpa batas di langganan pribadi, lalu berharap perilaku itu terbawa ke tempat kerja
- Justru memang ditawarkan
  Seat tim atau enterprise memang lebih mahal daripada harga konsumen, tetapi tetap harga tetap dengan batas penggunaan yang di-reset
  Anda bisa menetapkan seat yang setara dengan paket 20/100/200 dolar per bulan ke anggota, atau semuanya berbasis penggunaan
  Ada berbagai cara untuk membelinya
- Langganan untuk enterprise jelas memang ada
  Bahkan ada paket berbasis penggunaan yang setara dengan paket konsumen yang sama
- Saya sempat bingung kenapa langganan enterprise dibahas
  Perusahaan tempat saya bekerja ditagih berdasarkan penggunaan API
- Paragraf-paragraf seperti ini membuatnya terasa lebih seperti tulisan keluaran AI
  “Secara umum polanya sama. Penetapan harga untuk adopsi, bukan untuk unit economics. Mengunci organisasi. Menjadikan AI bagian yang menanggung beban dalam pekerjaan sehari-hari setiap tim. Urusan tagihan dipikirkan belakangan.”
- Bukan cuma itu, besaran tagihan API yang diributkan di tulisan itu juga masih relatif kecil
  10 ribu dolar per bulan bukanlah nol, tetapi jika dengan uang itu Anda mendukung tim beranggotakan 10~20 engineer, itu leverage yang cukup bagus
Saya tidak membaca seluruh tulisan aslinya sampai habis, tetapi saya bisa tahu itu ditulis AI
Mungkin OpenRouter bisa dipakai sebagai tolok ukur biaya dasar penyedia AI
Saya terus mendengar bahwa nilainya lebih baik daripada Claude, jadi kalau begitu kelihatannya Anthropic entah memang sangat tidak efisien atau memang mengambil untung dari inferensi
Mereka mungkin rugi di pelatihan, tetapi itu kemungkinan adalah biaya untuk tetap menjadi lab terdepan
Kalau ada satu perusahaan yang tumbang karena utang dan sebagainya, bukankah enterprise tinggal pindah saja?
Kalau saya melihat satu kali lagi frasa seperti “It’s not X. It’s Y.” atau penggunaan “load-bearing” sebagai metafora, saya bisa muntah
- Saya sudah melihat cukup banyak keluaran seperti itu, dan daftarnya tidak pendek
  “Era subsidi tidak berakhir dengan anggun. Ia memperlihatkan retak di mana-mana.”
  “Pertanyaannya bukan apakah itu pernah menjadi kesepakatan yang bagus. Pertanyaannya adalah berapa lama kesepakatan itu bisa bertahan.”
  “Pengembang yang menjalankan tiga atau empat coding agent sekaligus tidak memakai token 3 atau 4 kali lebih banyak daripada percakapan chat. Bukan beda satu digit; itu lebih dari satu orde besaran.”
  “Ini bukan lagi eksperimen. Ini adalah workflow yang menanggung beban.”
  “Itu bukan error pembulatan. Itu pos anggaran yang butuh kode anggaran sendiri.”
- Jika ada penyesuaian harga besar, banyak orang yang selama ini membuat komentar media sosial dengan paket gratis atau langganan 20 dolar per bulan mungkin akan melihat biaya nyatanya lalu kembali menulis sendiri
  Setidaknya kita boleh berharap begitu
- Saya juga sama bencinya dengan ungkapan “the unlock”
- Tulisan ini sebenarnya cukup bagus di awal
  Ada data dan logikanya terdengar masuk akal, tetapi begitu masuk pertengahan langsung muncul contoh tren, contoh lain, contoh ketiga, lalu “itu bukan sekadar X melainkan Y”
  Rasanya semenyebalkan membaca tulisan bagus lalu mengklik tautan sumber dan ternyata kena rickroll
Pelanggan enterprise tidak memakai langganan Claude Pro 20 dolar per bulan
Perusahaan kami memberi developer batas penggunaan sekitar 1.000 dolar per bulan, dan menurut saya penghematannya dibanding biaya API paling besar sekitar 30%
Itu bukan tingkat subsidi yang gila
Untuk jabatan lain sering kali hanya diberi 50 dolar per bulan, dan mereka terus menghabiskan batas itu
GitHub Copilot sudah lama memakai pendekatan seperti ini untuk seat bisnis dan enterprise, tetapi akan segera menabrak batas
Setelah Juni, ketika akun Pro dan Pro+ konsumen dirapikan ulang, saya rasa mereka akan cepat menyusul
OpenAI tampaknya sedang menghamburkan token untuk mengunci pelanggan, jadi setelah IPO saya paling khawatir pada perubahan harga dan syarat yang mendadak dari OpenAI
Anthropic sudah bertindak lebih bertanggung jawab di bagian ini, dan GitHub Copilot juga tampaknya sedang berusaha memperbaiki subsidi berlebihan dalam beberapa bulan ke depan
- Hanya GitHub Copilot yang benar-benar memberi subsidi yang absurd
  Itu karena penagihannya berdasarkan “request”, bukan token
  Satu request senilai 3 sen bisa saja membakar token senilai lebih dari 20 dolar, dan model itu berakhir bulan ini
  Saya juga khawatir karena selama ini memproses pekerjaan besar dengan GHCP, tetapi setelah melihat estimator tagihan baru, ternyata dengan harga API itu sekitar 150~200 dolar per bulan
  Itu tetap subsidi untuk langganan 20 dolar per bulan, tetapi bukan tingkat yang gila
  Jika alat coding bergaya agent dipakai secara intens namun bertanggung jawab, kemungkinan biayanya akan berada di kisaran 200 dolar per bulan menurut harga API
  Jika penyedia masih bisa untung pada harga itu, bagi perusahaan di Barat yang mempekerjakan developer, itu bukan angka yang sulit diterima jika mempertimbangkan waktu yang dihemat
  Risiko sebenarnya ada pada vibe coder yang mengerjakan proyek pribadi
  Era menyalahgunakan paket bersubsidi untuk membuat aplikasi raksasa sedang berakhir
Jika memang menggantikan developer, harga yang lebih mahal daripada 20 atau 100 dolar per bulan masuk akal
Masalah sebenarnya perusahaan LLM adalah mereka belum bisa menunjukkan nilai di area selain coding
Tanpa itu, mereka hanya akan turun derajat menjadi alat coding
Karena itulah mereka terburu-buru sekarang, dan yang penting adalah workflow pekerjaan apa lagi yang bisa diotomatisasi
Pekerjaan administratif mungkin semuanya bisa diotomatisasi
Jika area lain berkembang, mereka akan mengubah model harga
- Mereka juga sampai taraf tertentu sedang mencoba menggantikan Figma
  Itu mungkin bisa bernilai juga

taekim34 2026-05-19

Untuk menghemat token, yang penting adalah memeriksa secara real-time “seberapa banyak yang sedang saya gunakan sekarang”. Khususnya, penagihan berbasis token, berbeda dengan biaya langganan, bisa melonjak secara nonlinier tergantung pola penggunaan, jadi Anda perlu bisa melihat pada level sesi di mana biaya bocor agar bisa merespons. Jika Anda berada di lingkungan Claude Code, coba gunakan cc-token-saver (https://github.com/ww-w-ai/cc-token-saver). Alat ini menampilkan biaya per sesi dan per rentang secara real-time, otomatis memblokir pengiriman ulang mahal saat cache kedaluwarsa, dan bahkan secara otomatis mendelegasikan pekerjaan berat ke SubTask berbiaya rendah.

iolothebard 2026-05-18

Pada akhirnya akan tetap dipakai.
Dulu iPhone 3 harganya sekitar 200~300 dolar… sekarang sudah jauh melewati 1000 dolar, tapi tetap dipakai. Sudah telanjur merasakan enaknya.

prunusnira 2026-05-18

Sepertinya pembangunan LLM lokal akan semakin banyak dilakukan.

master6559 2026-05-18

Kalau mahal, ya tidak usah dipakai..

aer0700 2026-05-18

Karena berpikir orang tetap akan memakainya meski mahal, para penyedia LLM kemungkinan menaikkan harga. Saya jadi penasaran bagaimana nasib LLM open source seperti GLM, qwen, dan deepseek ke depannya. Orang-orang akan mulai menghitung, apakah harus membayar harga ini untuk memakai model frontier, atau justru lebih masuk akal memakai open source meski harus bersusah payah membangun infrastruktur vLLM sendiri.