Batas Penggunaan Mingguan Claude Code
(news.ycombinator.com)- Untuk layanan Claude Code dari Anthropic, kini diberlakukan batas penggunaan mingguan
- Berlaku bagi pengguna gratis maupun berbayar
- Pengguna dibatasi oleh jumlah kueri maksimum atau jumlah token yang diproses selama satu minggu
- Penerapan batas ini bertujuan mencegah penyalahgunaan layanan dan menjaga stabilitas sumber daya sistem
- Developer dan startup perlu memberi perhatian ekstra pada pengelolaan sumber daya saat memanfaatkan API
Ringkasan Penerapan Batas Penggunaan Mingguan Claude Code
Anthropic menerapkan kebijakan baru batas penggunaan mingguan pada layanan Claude Code
- Untuk seluruh pengguna (gratis dan berbayar), ditetapkan batas tertentu untuk penggunaan kueri atau token
- Batas ini diterapkan untuk mencegah penyalahgunaan layanan, memberikan layanan yang adil, dan menjaga stabilitas sumber daya infrastruktur
- Batas akan direset setiap minggu, dan jika terlampaui maka penggunaan tambahan tidak akan tersedia pada minggu tersebut
Dampak Utama bagi Developer dan Startup
- Saat memanfaatkan Claude Code dalam pengembangan produk, kebutuhan untuk merencanakan penggunaan menjadi lebih besar
- Layanan yang terintegrasi dengan API perlu menerapkan logika pengelolaan otomatis atau notifikasi saat batas terlampaui
- Jika melakukan pembuatan kode dalam jumlah besar, analisis, atau pemanggilan berulang, pentingnya optimasi pemanfaatan sumber daya semakin meningkat
Kesimpulan
- Penerapan kebijakan batas penggunaan mingguan pada Claude Code bertujuan meningkatkan keberlanjutan dan kualitas layanan
- Startup dan profesional IT perlu memeriksa batas mingguan serta menyusun rencana penggunaan saat mengintegrasikan sistem yang ada dan merancang layanan
1 komentar
Komentar Hacker News
Saya rasa saya mungkin tidak akan mencapai batas mingguan itu, tapi yang bikin tidak tenang adalah batasnya dihitung per minggu, bukan misalnya per 36 jam
Kalau kena batasnya, saya jadi tidak bisa memakainya selama sisa minggu itu
Tidak bisa memakai alat yang sudah terbiasa dipakai selama itu rasanya merepotkan
Mungkin ada yang bilang saya terlalu bergantung pada Claude, tapi hal yang sama juga berlaku untuk alat lain seperti ripgrep
Kalau tidak bisa pakai beberapa hari masih oke, tapi seminggu itu terlalu lama
Dan cukup menonjol juga bahwa mereka bilang hanya “kurang dari 5% pengguna” yang terdampak
Biasanya pengumuman seperti ini bilang yang terdampak kurang dari 1%, tapi Anthropic mengatakan 1 dari 20 orang akan melewati batas
Batas 100 kali/minggu untuk o3 di paket ChatGPT Plus rasanya persis seperti ini
Kita bahkan tidak bisa tahu sudah memakai berapa banyak, jadi karena ini sumber daya penting, secara naluriah jadi hemat memakainya
Akhirnya paketnya tidak benar-benar termanfaatkan dan malah pindah ke model seperti o4-mini
Menurut saya batas harian lebih baik
Tapi mungkin memang itu tujuan batas mingguan, supaya orang menahan diri dan berhemat bahkan sebelum mencapai batas
Menyedihkan melihat kenyataan bahwa para developer jadi bergantung pada layanan online tertutup dan eksklusif
Dulu semuanya bisa dilakukan dengan alat FOSS, dan tidak perlu tergantung pada perusahaan atau layanan tertentu sambil membayar langganan bulanan
Sekarang sebagian orang seperti petani Monsanto, harus membayar tiap bulan untuk memakai alat sampai-sampai lupa bagaimana cara bekerja tanpanya
Saya sering menyentuh batas Pro dengan sonnet sampai 3 kali sehari
Kalau Claude code dan claude dipakai bersamaan, habis dalam 30 menit
Saya juga tidak menjalankan multi-agent 24/7 atau membuka banyak jendela, tapi tetap begini
Saya juga tidak merasa termasuk pengguna 5% teratas, tapi kalau batasnya habis di hari Rabu saya juga tidak akan heran
Saya baru mau mencoba lebih banyak memanfaatkan chat Claude, tapi kalau beberapa hari saja sudah tidak bisa dipercaya untuk dipakai, rasanya jadi tidak ada gunanya
Anthropic bilang 1 dari 20 orang kena batas, tapi rasanya tidak mungkin ada sebanyak itu pengguna yang berbagi akun atau menjalankan otomatisasi 24/7
Kalau kena batas, bukan berarti tidak bisa dipakai sepanjang minggu penuh, hanya tidak bisa dipakai selama sisa waktu yang tersisa
Dia sendiri juga bilang kemungkinan besar tidak akan sering kena, jadi kalaupun kena, besar kemungkinan itu terjadi sekitar 36 jam terakhir di akhir minggu
Masih ada juga opsi membayar dan memakai lewat API
Saya tidak tahu dalam jangka panjang ini akan jadi seperti apa, tapi saya kurang suka harus selalu merasa bahwa LLM adalah sumber daya yang terbatas setiap kali memakainya
Orang-orang sudah terbiasa dengan paket tanpa batas
Model harga sekarang terasa dipaksakan dan tidak nyaman
Konsep tanpa batas memang cocok untuk layanan yang “biayanya begitu murah sampai nyaris tidak perlu diukur”
Internet, SMS, dan semacamnya bisa begitu karena biaya langsungnya sangat murah
Tapi LLM sampai sekarang masih punya biaya langsung yang cukup besar setiap kali dijalankan
Saya tidak setuju dengan struktur yang mengharapkan pemakaian stabil sepanjang bulan
Biasanya saya mungkin memakainya terus sepanjang bulan, lalu ada hari-hari tertentu saya pakai intensif sampai 11 jam dalam sehari, dan di situlah saya kemungkinan besar mentok batas
Karena itu, memakai API langsung terasa lebih baik karena batasnya mengikuti kedalaman dompet saya sendiri
Dengan memakai hal seperti OpenRouter, kita juga bisa menghindari keterbatasan model langganan
Belakangan ini Gemini 2.5 Pro terasa lebih cocok daripada Claude untuk pekerjaan coding
Saya juga penasaran opsi lain yang punya daya saing biaya bagus
https://docs.anthropic.com/en/api/rate-limits#rate-limits
Menurut saya, alat seperti ini seharusnya menghentikan model “$20 per bulan” atau “$200 per bulan” yang memberi akses ke jumlah terbatas sambil membuat perhitungan batasnya sulit dipahami
Harus beralih sepenuhnya ke model berbasis penggunaan kalau benar-benar ingin ramah pengguna
Bisa saja ada free tier seperti 20 kali gratis untuk percobaan awal, atau tarif bertingkat yang naik sesuai volume penggunaan, lalu pengguna ekstrem dikenai biaya mendekati ongkos riil
Dengan begitu, pengguna berpenggunaan rendah bisa tetap murah, dan pangsa pasar juga bisa dipertahankan
Kalau harganya lebih baik daripada OpenRouter, orang akan tetap tinggal di ekosistem ini alih-alih pindah ke alat pihak ketiga
Kalau alatnya benar-benar bagus, pengguna akan tetap bertahan meskipun berbasis penggunaan
Masalahnya, penyedia ingin mensubsidi pengguna demi pangsa pasar sambil tetap mencoba mencegah penyalahgunaan dan penggunaan ekstrem
Solusi 100% adalah benar-benar berbasis penggunaan, tanpa biaya masuk sama sekali
Tapi kalau begitu, orang yang cuma berlangganan dan sedikit memakai justru bisa rugi, jadi tim sales mungkin akan menolak
Dan dengan model seperti itu, orang juga jadi lebih mudah membandingkan dan pindah-pindah, tidak lagi merasa terkunci selama satu atau dua bulan
Dalam jangka panjang, saya rasa local LLM akan menjadi lebih baik daripada cloud LLM terbaik tahun 2025, sehingga 99% pekerjaan harian bisa ditangani tanpa batas
Dan kita hanya terhubung ke cloud untuk masalah yang benar-benar kompleks
LLM akan terus berkembang semakin efisien, sementara biaya GPU, memori, dan storage juga akan terus turun dan makin mudah diakses
Sekarang ini hanya terlihat canggung karena kita masih ada di masa transisi
Walaupun ini sumber daya terbatas, saya masih bisa menerimanya kalau saya tahu sudah memakai berapa banyak
Yang bikin tidak nyaman adalah tidak bisa melihat progres pemakaian
Saya bingung dengan perbedaan antara Max 5x dan Max 20x
Di email saya tertulis, “kebanyakan pengguna Max 20x bisa memakai Sonnet 4 selama 240–480 jam per minggu, dan Opus 4 selama 24–40 jam”
Di pengumuman resmi tertulis, “kebanyakan pengguna Max 5x bisa memakai Sonnet 4 selama 140–280 jam per minggu, dan Opus 4 selama 15–35 jam”
Saya sih maunya batasnya setidaknya lebih dari 2x secara proporsional terhadap harga, tapi untuk Opus 4 bedanya cuma sekitar 5–9 jam
Bukankah minimal harus 2x? Padahal harganya dua kali lipat
Kalau memang begini kenyataannya, saya akan langsung turun paket dari Max 20x ke paket yang lebih rendah
Di Australia saya bayar $350 per bulan
Saya upgrade ke 20x karena terus mentok di batas Opus, tapi sekarang kelihatan bahwa perbedaan 20x dan 5x hampir tidak ada
Karena itu saya berhenti memakai MAX dan turun ke Pro, lalu memakai o3 dan model lain lewat API
Di awal saya memang tidak butuh waktu sebanyak itu, jadi sekitar $10 per proyek cukup untuk memakai o3, Gemini, dan Opus
Model baru muncul tiap beberapa hari, jadi saya tidak ingin terkunci ke satu penyedia saja
Dalam praktiknya, itu bukan berarti penggunaan 2x lebih banyak, melainkan hanya prioritas yang lebih tinggi saat traffic sedang padat
Kalau materi pemasarannya ternyata tidak sesuai fakta, saya harap ada yang meneliti dengan data nyata lalu mengajukan class action
Saya paham bahwa bahkan membayar $200 per bulan pun masih belum cukup
Kalau begitu, seharusnya ada juga paket yang benar-benar cukup supaya orang bisa memakainya tanpa khawatir soal batas
Tidak ada yang lebih merusak alur kerja daripada pesan seperti “waktu habis!”
Kalau modelnya berbasis kredit, setidaknya kita bisa lihat sudah terpakai berapa dan bayar tambahan kalau perlu
Konsep “tunggu sementara GPU didinginkan” sama sekali tidak membantu produktivitas
Kalau menjalankan beberapa agent sekaligus, ‘35 jam’ itu jelas jauh dari cukup
Aneh juga kalau alatnya sendiri memang dirancang untuk mendukung pola pakai seperti itu
Kalau mereka mengubahnya menjadi paket yang cukup untuk semua orang sekaligus tetap menguntungkan, justru bisa-bisa semua orang pindah ke kompetitor
Membuat pengguna bergantung pada alatnya lalu menaikkan harga perlahan mungkin justru strategi yang cukup masuk akal
Saya tidak menganggap “menjalankan beberapa agent sekaligus” sebagai use case umum di paket personal
Untuk hal seperti itu, dari dulu memang harus bayar penggunaan langsung lewat API
Kalau paket tarif tetap mengizinkan hal seperti itu, itu berarti layanannya sedang murah hati, dan dari awal mereka hanya mengiklankan “batas lebih tinggi”, bukan “tanpa batas”
API jauh lebih longgar soal batas, dan dalam praktiknya hampir tidak terbatas
Claude juga bisa dipakai di Aws dan gcp, dengan batas, kredit, dan tarif yang berbeda-beda di masing-masing platform
Kebijakan semestinya dioptimalkan berdasarkan “pengguna baik”, bukan disetel berdasarkan “pengguna buruk”
Tinggal pakai API saja
Secara keseluruhan, saya melihat ini sebagai perubahan yang positif karena melindungi sistem dari sebagian pengguna yang menjalankan banyak agent 24/7
Sehingga lebih banyak pengguna bisa terus memakai layanan secara konsisten
Meski begitu, tetap tidak nyaman bahwa mereka tidak menunjukkan “berapa banyak kuota yang masih tersisa”
Entah persentasenya berapa, tapi setidaknya kalau ada notifikasi di titik tertentu, misalnya saat sudah melewati separuh, akan jauh lebih mudah untuk merencanakan penggunaan
Tidak diberikannya informasi ini malah membuat saya berpikir, “apa mereka memang tidak ingin kita bisa mengukurnya?”
Saya bukan ingin mengukurnya secara rinci, cuma ingin tahu posisi saya secara kasar
Menurut akun Reddit Anthropic
Ada satu pengguna yang memakai LLM senilai puluhan ribu dolar dari paket $200
Pihak perusahaan sedang mengembangkan solusi terpisah untuk pengguna tingkat lanjut
Tapi batas baru ini dibuat demi pengalaman yang lebih adil dan untuk mencegah berbagi akun serta penjualan kembali
Jadi inilah alasan kita tidak bisa punya “layanan yang bagus”
Startup tempat saya dulu bekerja juga pernah menawarkan opsi tanpa batas
Awalnya kami pikir tidak ada orang yang akan bisa memakainya sebanyak itu, tapi kenyataannya terlalu banyak pengguna yang secara kreatif menjual batas layanan kami
Akun-akun itu terhubung ke layanan 24/7 dan terus menembakkan permintaan sampai 95% dari limit request
Mereka juga memakai berbagai IP dan menunjukkan pola yang bahkan tidak tampak seperti dipakai manusia
Awalnya kami menerima itu sebagai outlier, tapi ketika akun-akun seperti ini tumbuh secara eksponensial
Ternyata sebenarnya ada beberapa perusahaan yang membuat banyak akun lalu melakukan load balancing di antara akun-akun itu
Kalau melihat grafik rata-rata untung-rugi per pengguna, akun-akun seperti ini hanya meninggalkan kerugian besar sambil menghabiskan sumber daya sampai batas maksimal, dan akhirnya kebijakan pun diubah
Kita memang kehilangan “pelanggan” seperti itu, tapi mayoritas pengguna biasa tidak terdampak
Malah keseluruhan layanan jadi lebih nyaman
Pengalaman seperti ini dialami semua startup dengan penggunaan tinggi
Bisa jadi sebenarnya perusahaan memang menjual layanan itu sambil merugi
Apakah penyalahgunaan seperti ini benar-benar tidak bisa dihentikan bahkan dengan batas saat ini? Saya agak tidak paham
Kemarin ada seseorang di Twitter yang membanggakannya
Dia memakai akun $200 untuk penggunaan senilai $13.200, dan menjalankan 4–5 agent khusus Opus 24/7 yang saling memanggil secara rekursif
Itu jelas penyalahgunaan dan memang layak ditargetkan
Tapi saya juga tidak tahu bagaimana tepatnya penyedia inference harus mencegah hal seperti ini
Cursor sudah menjadi lebih sulit karena menambahkan premium yang lebih besar dibanding Anthropc/OpenAI
Anthropic juga berada di situasi serupa, tapi di sini tidak ada opsi premium
Kalau misalnya dengan $20 per bulan kita hanya diizinkan sampai ongkos riil $500 per bulan, itu berarti diskon 95%, dan struktur seperti itu jelas tidak akan bertahan
Kalau model subsidi seperti ini terus diterapkan, suasana “merasa berhak” di komunitas juga akan makin besar
Memang rasanya seperti sesuatu yang sudah dibiasakan lalu diambil kembali, tapi kalau melihat cap/opex saja sebenarnya sudah tidak masuk akal, belum lagi biaya R&D, sehingga bahkan mempertahankan modelnya sendiri pun jadi sulit
Jadi pada praktiknya, yang bisa dilakukan hanya “terus mengubah struktur harga, lalu membiarkan pengguna pindah ke perusahaan berikutnya yang mensubsidi lebih besar”
Sebenarnya akan lebih baik kalau kebijakan seperti ini sejak awal dijelaskan sebagai trial, dan secara transparan diberi tahu seberapa besar subsidinya
Orang-orang tetap bisa mencoba modelnya, sebagian akan bertahan, dan meskipun ada sebagian yang pergi, tingkat keluhan mungkin akan lebih rendah
Kalau struktur cap/biaya operasional/biaya pengembangannya benar-benar dijelaskan secara transparan
Orang juga mungkin akan paham bahwa itu setara dengan biaya mempekerjakan satu senior engineer tanpa lelah
Email ini akan jauh lebih berguna kalau tiap bulan ada informasi seperti “bulan mana Anda mencapai batas (Aug 2024, Jan 2025, May 2025, dll.)”
Saya sama sekali tidak tahu apakah saya termasuk 5% teratas atau tidak
Sebenarnya saya bisa menerima pembatasan untuk 1%, tapi di industri SaaS, 5% itu sudah mencakup sebagian besar pengguna aktif sebenarnya
Layanan seperti ini memang butuh paket harga terukur berbasis pemakaian
Semua perusahaan AI menghadapi masalah yang sama
Langganan tarif tetap dibangun dengan asumsi bahwa pengguna tidak ingin terlalu memikirkan biaya
Tapi segelintir power user justru mendorong batas langganan sampai ekstrem
Sampai ada layanan seperti Terragon yang dikembangkan khusus untuk mengoptimalkan penggunaan seperti itu
Akibatnya, perusahaan terus menurunkan batas, dan pengguna malah jadi makin memikirkan biaya
Cursor juga sudah berkali-kali menyesuaikan batas, dan sekarang Anthropic ikut ke arah yang sama
Pada akhirnya mereka hanya tidak mau lagi mensubsidi 10% pengguna paling ekstrem
Akan bagus kalau ada paket web dengan billing berbasis penggunaan langsung di antarmuka web
API sudah ada, jadi kita bisa langsung membuat token sendiri dan memakai Claude Code tanpa paket terpisah
Ini mengingatkan saya pada masa shared hosting di tahun 1990-an
Kalau mereka menyediakan paket web berbasis meteran, mereka harus mengungkap seberapa mahal biaya inference yang sebenarnya, dan itu akan merepotkan
Menjalankan AI pada tingkat penggunaan nyata yang produktif saat ini memang masih sangat mahal
Karena “pola penggunaan tingkat lanjut yang menjalankan Claude 24/7 di latar belakang”, kita jadi tidak bisa menikmati layanan yang bagus
Saat layanan AI diiklankan, mereka justru menekankan hal seperti “AI akan menjalankan pekerjaan sendiri. Developer bisa minum kopi atau tidur sementara pekerjaan tetap selesai”
Jadi ada developer yang memang memakainya secara wajar sesuai janji itu
Sekarang aneh kalau pengguna seperti itu justru disalahkan sebagai masalahnya
Bagian itu membuat saya tertawa
Rasanya seperti “penghancur dunia berniat baik” yang sedang mempercepat kematian panas alam semesta
Saya rasa masalah seperti ini memang sudah sepenuhnya bisa diprediksi
Seharusnya sudah dipertimbangkan matang saat menentukan paket awal
Mungkin mereka hanya tidak ingin itu menghambat peluncuran, jadi implementasinya ditunda, dan sekarang baru mulai diterapkan sesuai realitas
Bagaimanapun struktur harganya ditetapkan, pengguna akan berusaha memanfaatkan paketnya 100%
Saya pelanggan Max, tapi tetap sering kena batas
Aneh rasanya ketika saya memakai sesuai yang saya bayar, tapi tetap dikenai pembatasan
Ini memang struktur eksperimen harga
Kalau pembatasannya longgar, cepat atau lambat akan muncul pengguna dengan pola pemakaian ekstrem, lalu perusahaan akan mengemas sesuatu yang sebenarnya tidak berkelanjutan seolah-olah bisa dilakukan, dan nanti bonusnya diambil kembali
Mungkin ini usul yang agak aneh, tapi saya sempat memikirkan bagaimana kalau batasnya adaptif
Opsi 1: di awal pengguna boleh memakai sangat intens dalam periode singkat, lalu kecepatannya diturunkan bertahap, dan setelah cooldown selesai bisa “meledak” lagi
Dengan begitu pengguna bisa memaksimalkan produktivitas dalam waktu singkat, dan server juga sempat beristirahat
Opsi 2: seperti data seluler, jumlah request tertentu bisa dipakai dengan cepat, lalu setelah itu dikenai throttle, dan kalau butuh lebih banyak bisa beli tambahan
Ini juga membuka model pendapatan tambahan
Opsi 3: alokasi sumber daya adaptif di infrastruktur dan jaringan
Pekerjaan non-GPU bisa diberi prioritas lebih rendah, request jaringan diproses lebih lambat, atau lewat k8s pekerjaan didistribusikan ke server berbeda sesuai penggunaan
Dan di luar perdebatan soal limit, ada baiknya juga melacak request mana yang benar-benar menghabiskan biaya besar, supaya jalur kode yang tidak efisien atau struktur infrastruktur yang boros bisa diperbaiki
Saya ingin menekankan bahwa optimasi kode kecil pun bisa memberi ruang longgar yang besar bagi sistem