1 poin oleh GN⁺ 2025-07-29 | 1 komentar | Bagikan ke WhatsApp
  • Untuk layanan Claude Code dari Anthropic, kini diberlakukan batas penggunaan mingguan
  • Berlaku bagi pengguna gratis maupun berbayar
  • Pengguna dibatasi oleh jumlah kueri maksimum atau jumlah token yang diproses selama satu minggu
  • Penerapan batas ini bertujuan mencegah penyalahgunaan layanan dan menjaga stabilitas sumber daya sistem
  • Developer dan startup perlu memberi perhatian ekstra pada pengelolaan sumber daya saat memanfaatkan API

Ringkasan Penerapan Batas Penggunaan Mingguan Claude Code

Anthropic menerapkan kebijakan baru batas penggunaan mingguan pada layanan Claude Code

  • Untuk seluruh pengguna (gratis dan berbayar), ditetapkan batas tertentu untuk penggunaan kueri atau token
  • Batas ini diterapkan untuk mencegah penyalahgunaan layanan, memberikan layanan yang adil, dan menjaga stabilitas sumber daya infrastruktur
  • Batas akan direset setiap minggu, dan jika terlampaui maka penggunaan tambahan tidak akan tersedia pada minggu tersebut

Dampak Utama bagi Developer dan Startup

  • Saat memanfaatkan Claude Code dalam pengembangan produk, kebutuhan untuk merencanakan penggunaan menjadi lebih besar
  • Layanan yang terintegrasi dengan API perlu menerapkan logika pengelolaan otomatis atau notifikasi saat batas terlampaui
  • Jika melakukan pembuatan kode dalam jumlah besar, analisis, atau pemanggilan berulang, pentingnya optimasi pemanfaatan sumber daya semakin meningkat

Kesimpulan

  • Penerapan kebijakan batas penggunaan mingguan pada Claude Code bertujuan meningkatkan keberlanjutan dan kualitas layanan
  • Startup dan profesional IT perlu memeriksa batas mingguan serta menyusun rencana penggunaan saat mengintegrasikan sistem yang ada dan merancang layanan

1 komentar

 
GN⁺ 2025-07-29
Komentar Hacker News
  • Saya rasa saya mungkin tidak akan mencapai batas mingguan itu, tapi yang bikin tidak tenang adalah batasnya dihitung per minggu, bukan misalnya per 36 jam
    Kalau kena batasnya, saya jadi tidak bisa memakainya selama sisa minggu itu
    Tidak bisa memakai alat yang sudah terbiasa dipakai selama itu rasanya merepotkan
    Mungkin ada yang bilang saya terlalu bergantung pada Claude, tapi hal yang sama juga berlaku untuk alat lain seperti ripgrep
    Kalau tidak bisa pakai beberapa hari masih oke, tapi seminggu itu terlalu lama
    Dan cukup menonjol juga bahwa mereka bilang hanya “kurang dari 5% pengguna” yang terdampak
    Biasanya pengumuman seperti ini bilang yang terdampak kurang dari 1%, tapi Anthropic mengatakan 1 dari 20 orang akan melewati batas

    • Batas 100 kali/minggu untuk o3 di paket ChatGPT Plus rasanya persis seperti ini
      Kita bahkan tidak bisa tahu sudah memakai berapa banyak, jadi karena ini sumber daya penting, secara naluriah jadi hemat memakainya
      Akhirnya paketnya tidak benar-benar termanfaatkan dan malah pindah ke model seperti o4-mini
      Menurut saya batas harian lebih baik
      Tapi mungkin memang itu tujuan batas mingguan, supaya orang menahan diri dan berhemat bahkan sebelum mencapai batas

    • Menyedihkan melihat kenyataan bahwa para developer jadi bergantung pada layanan online tertutup dan eksklusif
      Dulu semuanya bisa dilakukan dengan alat FOSS, dan tidak perlu tergantung pada perusahaan atau layanan tertentu sambil membayar langganan bulanan
      Sekarang sebagian orang seperti petani Monsanto, harus membayar tiap bulan untuk memakai alat sampai-sampai lupa bagaimana cara bekerja tanpanya

    • Saya sering menyentuh batas Pro dengan sonnet sampai 3 kali sehari
      Kalau Claude code dan claude dipakai bersamaan, habis dalam 30 menit
      Saya juga tidak menjalankan multi-agent 24/7 atau membuka banyak jendela, tapi tetap begini
      Saya juga tidak merasa termasuk pengguna 5% teratas, tapi kalau batasnya habis di hari Rabu saya juga tidak akan heran
      Saya baru mau mencoba lebih banyak memanfaatkan chat Claude, tapi kalau beberapa hari saja sudah tidak bisa dipercaya untuk dipakai, rasanya jadi tidak ada gunanya

    • Anthropic bilang 1 dari 20 orang kena batas, tapi rasanya tidak mungkin ada sebanyak itu pengguna yang berbagi akun atau menjalankan otomatisasi 24/7

    • Kalau kena batas, bukan berarti tidak bisa dipakai sepanjang minggu penuh, hanya tidak bisa dipakai selama sisa waktu yang tersisa
      Dia sendiri juga bilang kemungkinan besar tidak akan sering kena, jadi kalaupun kena, besar kemungkinan itu terjadi sekitar 36 jam terakhir di akhir minggu
      Masih ada juga opsi membayar dan memakai lewat API

  • Saya tidak tahu dalam jangka panjang ini akan jadi seperti apa, tapi saya kurang suka harus selalu merasa bahwa LLM adalah sumber daya yang terbatas setiap kali memakainya
    Orang-orang sudah terbiasa dengan paket tanpa batas
    Model harga sekarang terasa dipaksakan dan tidak nyaman

    • Konsep tanpa batas memang cocok untuk layanan yang “biayanya begitu murah sampai nyaris tidak perlu diukur”
      Internet, SMS, dan semacamnya bisa begitu karena biaya langsungnya sangat murah
      Tapi LLM sampai sekarang masih punya biaya langsung yang cukup besar setiap kali dijalankan

    • Saya tidak setuju dengan struktur yang mengharapkan pemakaian stabil sepanjang bulan
      Biasanya saya mungkin memakainya terus sepanjang bulan, lalu ada hari-hari tertentu saya pakai intensif sampai 11 jam dalam sehari, dan di situlah saya kemungkinan besar mentok batas
      Karena itu, memakai API langsung terasa lebih baik karena batasnya mengikuti kedalaman dompet saya sendiri
      Dengan memakai hal seperti OpenRouter, kita juga bisa menghindari keterbatasan model langganan
      Belakangan ini Gemini 2.5 Pro terasa lebih cocok daripada Claude untuk pekerjaan coding
      Saya juga penasaran opsi lain yang punya daya saing biaya bagus
      https://docs.anthropic.com/en/api/rate-limits#rate-limits

    • Menurut saya, alat seperti ini seharusnya menghentikan model “$20 per bulan” atau “$200 per bulan” yang memberi akses ke jumlah terbatas sambil membuat perhitungan batasnya sulit dipahami
      Harus beralih sepenuhnya ke model berbasis penggunaan kalau benar-benar ingin ramah pengguna
      Bisa saja ada free tier seperti 20 kali gratis untuk percobaan awal, atau tarif bertingkat yang naik sesuai volume penggunaan, lalu pengguna ekstrem dikenai biaya mendekati ongkos riil
      Dengan begitu, pengguna berpenggunaan rendah bisa tetap murah, dan pangsa pasar juga bisa dipertahankan
      Kalau harganya lebih baik daripada OpenRouter, orang akan tetap tinggal di ekosistem ini alih-alih pindah ke alat pihak ketiga
      Kalau alatnya benar-benar bagus, pengguna akan tetap bertahan meskipun berbasis penggunaan
      Masalahnya, penyedia ingin mensubsidi pengguna demi pangsa pasar sambil tetap mencoba mencegah penyalahgunaan dan penggunaan ekstrem
      Solusi 100% adalah benar-benar berbasis penggunaan, tanpa biaya masuk sama sekali
      Tapi kalau begitu, orang yang cuma berlangganan dan sedikit memakai justru bisa rugi, jadi tim sales mungkin akan menolak
      Dan dengan model seperti itu, orang juga jadi lebih mudah membandingkan dan pindah-pindah, tidak lagi merasa terkunci selama satu atau dua bulan

    • Dalam jangka panjang, saya rasa local LLM akan menjadi lebih baik daripada cloud LLM terbaik tahun 2025, sehingga 99% pekerjaan harian bisa ditangani tanpa batas
      Dan kita hanya terhubung ke cloud untuk masalah yang benar-benar kompleks
      LLM akan terus berkembang semakin efisien, sementara biaya GPU, memori, dan storage juga akan terus turun dan makin mudah diakses
      Sekarang ini hanya terlihat canggung karena kita masih ada di masa transisi

    • Walaupun ini sumber daya terbatas, saya masih bisa menerimanya kalau saya tahu sudah memakai berapa banyak
      Yang bikin tidak nyaman adalah tidak bisa melihat progres pemakaian

  • Saya bingung dengan perbedaan antara Max 5x dan Max 20x
    Di email saya tertulis, “kebanyakan pengguna Max 20x bisa memakai Sonnet 4 selama 240–480 jam per minggu, dan Opus 4 selama 24–40 jam”
    Di pengumuman resmi tertulis, “kebanyakan pengguna Max 5x bisa memakai Sonnet 4 selama 140–280 jam per minggu, dan Opus 4 selama 15–35 jam”
    Saya sih maunya batasnya setidaknya lebih dari 2x secara proporsional terhadap harga, tapi untuk Opus 4 bedanya cuma sekitar 5–9 jam
    Bukankah minimal harus 2x? Padahal harganya dua kali lipat

    • Kalau memang begini kenyataannya, saya akan langsung turun paket dari Max 20x ke paket yang lebih rendah
      Di Australia saya bayar $350 per bulan

    • Saya upgrade ke 20x karena terus mentok di batas Opus, tapi sekarang kelihatan bahwa perbedaan 20x dan 5x hampir tidak ada

    • Karena itu saya berhenti memakai MAX dan turun ke Pro, lalu memakai o3 dan model lain lewat API
      Di awal saya memang tidak butuh waktu sebanyak itu, jadi sekitar $10 per proyek cukup untuk memakai o3, Gemini, dan Opus
      Model baru muncul tiap beberapa hari, jadi saya tidak ingin terkunci ke satu penyedia saja

    • Dalam praktiknya, itu bukan berarti penggunaan 2x lebih banyak, melainkan hanya prioritas yang lebih tinggi saat traffic sedang padat

    • Kalau materi pemasarannya ternyata tidak sesuai fakta, saya harap ada yang meneliti dengan data nyata lalu mengajukan class action

  • Saya paham bahwa bahkan membayar $200 per bulan pun masih belum cukup
    Kalau begitu, seharusnya ada juga paket yang benar-benar cukup supaya orang bisa memakainya tanpa khawatir soal batas
    Tidak ada yang lebih merusak alur kerja daripada pesan seperti “waktu habis!”
    Kalau modelnya berbasis kredit, setidaknya kita bisa lihat sudah terpakai berapa dan bayar tambahan kalau perlu
    Konsep “tunggu sementara GPU didinginkan” sama sekali tidak membantu produktivitas
    Kalau menjalankan beberapa agent sekaligus, ‘35 jam’ itu jelas jauh dari cukup
    Aneh juga kalau alatnya sendiri memang dirancang untuk mendukung pola pakai seperti itu

    • Kalau mereka mengubahnya menjadi paket yang cukup untuk semua orang sekaligus tetap menguntungkan, justru bisa-bisa semua orang pindah ke kompetitor
      Membuat pengguna bergantung pada alatnya lalu menaikkan harga perlahan mungkin justru strategi yang cukup masuk akal

    • Saya tidak menganggap “menjalankan beberapa agent sekaligus” sebagai use case umum di paket personal
      Untuk hal seperti itu, dari dulu memang harus bayar penggunaan langsung lewat API
      Kalau paket tarif tetap mengizinkan hal seperti itu, itu berarti layanannya sedang murah hati, dan dari awal mereka hanya mengiklankan “batas lebih tinggi”, bukan “tanpa batas”

    • API jauh lebih longgar soal batas, dan dalam praktiknya hampir tidak terbatas
      Claude juga bisa dipakai di Aws dan gcp, dengan batas, kredit, dan tarif yang berbeda-beda di masing-masing platform

    • Kebijakan semestinya dioptimalkan berdasarkan “pengguna baik”, bukan disetel berdasarkan “pengguna buruk”

    • Tinggal pakai API saja

  • Secara keseluruhan, saya melihat ini sebagai perubahan yang positif karena melindungi sistem dari sebagian pengguna yang menjalankan banyak agent 24/7
    Sehingga lebih banyak pengguna bisa terus memakai layanan secara konsisten
    Meski begitu, tetap tidak nyaman bahwa mereka tidak menunjukkan “berapa banyak kuota yang masih tersisa”
    Entah persentasenya berapa, tapi setidaknya kalau ada notifikasi di titik tertentu, misalnya saat sudah melewati separuh, akan jauh lebih mudah untuk merencanakan penggunaan
    Tidak diberikannya informasi ini malah membuat saya berpikir, “apa mereka memang tidak ingin kita bisa mengukurnya?”
    Saya bukan ingin mengukurnya secara rinci, cuma ingin tahu posisi saya secara kasar

  • Menurut akun Reddit Anthropic
    Ada satu pengguna yang memakai LLM senilai puluhan ribu dolar dari paket $200
    Pihak perusahaan sedang mengembangkan solusi terpisah untuk pengguna tingkat lanjut
    Tapi batas baru ini dibuat demi pengalaman yang lebih adil dan untuk mencegah berbagi akun serta penjualan kembali
    Jadi inilah alasan kita tidak bisa punya “layanan yang bagus”

    • Startup tempat saya dulu bekerja juga pernah menawarkan opsi tanpa batas
      Awalnya kami pikir tidak ada orang yang akan bisa memakainya sebanyak itu, tapi kenyataannya terlalu banyak pengguna yang secara kreatif menjual batas layanan kami
      Akun-akun itu terhubung ke layanan 24/7 dan terus menembakkan permintaan sampai 95% dari limit request
      Mereka juga memakai berbagai IP dan menunjukkan pola yang bahkan tidak tampak seperti dipakai manusia
      Awalnya kami menerima itu sebagai outlier, tapi ketika akun-akun seperti ini tumbuh secara eksponensial
      Ternyata sebenarnya ada beberapa perusahaan yang membuat banyak akun lalu melakukan load balancing di antara akun-akun itu
      Kalau melihat grafik rata-rata untung-rugi per pengguna, akun-akun seperti ini hanya meninggalkan kerugian besar sambil menghabiskan sumber daya sampai batas maksimal, dan akhirnya kebijakan pun diubah
      Kita memang kehilangan “pelanggan” seperti itu, tapi mayoritas pengguna biasa tidak terdampak
      Malah keseluruhan layanan jadi lebih nyaman
      Pengalaman seperti ini dialami semua startup dengan penggunaan tinggi

    • Bisa jadi sebenarnya perusahaan memang menjual layanan itu sambil merugi

    • Apakah penyalahgunaan seperti ini benar-benar tidak bisa dihentikan bahkan dengan batas saat ini? Saya agak tidak paham

    • Kemarin ada seseorang di Twitter yang membanggakannya
      Dia memakai akun $200 untuk penggunaan senilai $13.200, dan menjalankan 4–5 agent khusus Opus 24/7 yang saling memanggil secara rekursif
      Itu jelas penyalahgunaan dan memang layak ditargetkan
      Tapi saya juga tidak tahu bagaimana tepatnya penyedia inference harus mencegah hal seperti ini
      Cursor sudah menjadi lebih sulit karena menambahkan premium yang lebih besar dibanding Anthropc/OpenAI
      Anthropic juga berada di situasi serupa, tapi di sini tidak ada opsi premium
      Kalau misalnya dengan $20 per bulan kita hanya diizinkan sampai ongkos riil $500 per bulan, itu berarti diskon 95%, dan struktur seperti itu jelas tidak akan bertahan
      Kalau model subsidi seperti ini terus diterapkan, suasana “merasa berhak” di komunitas juga akan makin besar
      Memang rasanya seperti sesuatu yang sudah dibiasakan lalu diambil kembali, tapi kalau melihat cap/opex saja sebenarnya sudah tidak masuk akal, belum lagi biaya R&D, sehingga bahkan mempertahankan modelnya sendiri pun jadi sulit
      Jadi pada praktiknya, yang bisa dilakukan hanya “terus mengubah struktur harga, lalu membiarkan pengguna pindah ke perusahaan berikutnya yang mensubsidi lebih besar”
      Sebenarnya akan lebih baik kalau kebijakan seperti ini sejak awal dijelaskan sebagai trial, dan secara transparan diberi tahu seberapa besar subsidinya
      Orang-orang tetap bisa mencoba modelnya, sebagian akan bertahan, dan meskipun ada sebagian yang pergi, tingkat keluhan mungkin akan lebih rendah
      Kalau struktur cap/biaya operasional/biaya pengembangannya benar-benar dijelaskan secara transparan
      Orang juga mungkin akan paham bahwa itu setara dengan biaya mempekerjakan satu senior engineer tanpa lelah

  • Email ini akan jauh lebih berguna kalau tiap bulan ada informasi seperti “bulan mana Anda mencapai batas (Aug 2024, Jan 2025, May 2025, dll.)”
    Saya sama sekali tidak tahu apakah saya termasuk 5% teratas atau tidak
    Sebenarnya saya bisa menerima pembatasan untuk 1%, tapi di industri SaaS, 5% itu sudah mencakup sebagian besar pengguna aktif sebenarnya

  • Layanan seperti ini memang butuh paket harga terukur berbasis pemakaian
    Semua perusahaan AI menghadapi masalah yang sama
    Langganan tarif tetap dibangun dengan asumsi bahwa pengguna tidak ingin terlalu memikirkan biaya
    Tapi segelintir power user justru mendorong batas langganan sampai ekstrem
    Sampai ada layanan seperti Terragon yang dikembangkan khusus untuk mengoptimalkan penggunaan seperti itu
    Akibatnya, perusahaan terus menurunkan batas, dan pengguna malah jadi makin memikirkan biaya
    Cursor juga sudah berkali-kali menyesuaikan batas, dan sekarang Anthropic ikut ke arah yang sama
    Pada akhirnya mereka hanya tidak mau lagi mensubsidi 10% pengguna paling ekstrem
    Akan bagus kalau ada paket web dengan billing berbasis penggunaan langsung di antarmuka web

    • API sudah ada, jadi kita bisa langsung membuat token sendiri dan memakai Claude Code tanpa paket terpisah

    • Ini mengingatkan saya pada masa shared hosting di tahun 1990-an

    • Kalau mereka menyediakan paket web berbasis meteran, mereka harus mengungkap seberapa mahal biaya inference yang sebenarnya, dan itu akan merepotkan
      Menjalankan AI pada tingkat penggunaan nyata yang produktif saat ini memang masih sangat mahal

  • Karena “pola penggunaan tingkat lanjut yang menjalankan Claude 24/7 di latar belakang”, kita jadi tidak bisa menikmati layanan yang bagus

    • Saat layanan AI diiklankan, mereka justru menekankan hal seperti “AI akan menjalankan pekerjaan sendiri. Developer bisa minum kopi atau tidur sementara pekerjaan tetap selesai”
      Jadi ada developer yang memang memakainya secara wajar sesuai janji itu
      Sekarang aneh kalau pengguna seperti itu justru disalahkan sebagai masalahnya

    • Bagian itu membuat saya tertawa
      Rasanya seperti “penghancur dunia berniat baik” yang sedang mempercepat kematian panas alam semesta

    • Saya rasa masalah seperti ini memang sudah sepenuhnya bisa diprediksi
      Seharusnya sudah dipertimbangkan matang saat menentukan paket awal
      Mungkin mereka hanya tidak ingin itu menghambat peluncuran, jadi implementasinya ditunda, dan sekarang baru mulai diterapkan sesuai realitas

    • Bagaimanapun struktur harganya ditetapkan, pengguna akan berusaha memanfaatkan paketnya 100%
      Saya pelanggan Max, tapi tetap sering kena batas
      Aneh rasanya ketika saya memakai sesuai yang saya bayar, tapi tetap dikenai pembatasan

    • Ini memang struktur eksperimen harga
      Kalau pembatasannya longgar, cepat atau lambat akan muncul pengguna dengan pola pemakaian ekstrem, lalu perusahaan akan mengemas sesuatu yang sebenarnya tidak berkelanjutan seolah-olah bisa dilakukan, dan nanti bonusnya diambil kembali

  • Mungkin ini usul yang agak aneh, tapi saya sempat memikirkan bagaimana kalau batasnya adaptif
    Opsi 1: di awal pengguna boleh memakai sangat intens dalam periode singkat, lalu kecepatannya diturunkan bertahap, dan setelah cooldown selesai bisa “meledak” lagi
    Dengan begitu pengguna bisa memaksimalkan produktivitas dalam waktu singkat, dan server juga sempat beristirahat
    Opsi 2: seperti data seluler, jumlah request tertentu bisa dipakai dengan cepat, lalu setelah itu dikenai throttle, dan kalau butuh lebih banyak bisa beli tambahan
    Ini juga membuka model pendapatan tambahan
    Opsi 3: alokasi sumber daya adaptif di infrastruktur dan jaringan
    Pekerjaan non-GPU bisa diberi prioritas lebih rendah, request jaringan diproses lebih lambat, atau lewat k8s pekerjaan didistribusikan ke server berbeda sesuai penggunaan
    Dan di luar perdebatan soal limit, ada baiknya juga melacak request mana yang benar-benar menghabiskan biaya besar, supaya jalur kode yang tidak efisien atau struktur infrastruktur yang boros bisa diperbaiki
    Saya ingin menekankan bahwa optimasi kode kecil pun bisa memberi ruang longgar yang besar bagi sistem