- Dalam pola penggunaan berbasis agen, model berlangganan menunjukkan efisiensi biaya 36x lebih tinggi
- Paket ‘Max 5x’ memiliki batas sesi 6x, batas mingguan 8,3x, sehingga angka penggunaan nyata bisa lebih besar daripada yang ditampilkan dalam pemasaran
- Paket ‘Max 20x’ hanya meluas 20x jika dihitung berdasarkan sesi 5 jam, sementara batas mingguannya hanya sekitar 2x dibanding Max 5x
- Di antarmuka web, biaya penggunaan ulang konteks yang di-cache adalah 0, sedangkan pada API, saat konteks yang sama dikirim ulang, 10% dari biaya input ditagihkan berulang
- Dengan merekonstruksi balik angka batas langganan dari nilai penggunaan floating-point, struktur internal kredit dan token dapat dianalisis secara presisi
Latar belakang analisis dan pendekatan
- Angka desimal penggunaan yang sangat presisi dan tidak lazim yang ditampilkan di Claude web UI dikonfirmasi sebagai hasil perhitungan internal
- Nilai seperti
0.16327272727272726diperkirakan berasal dari sistem kredit internal berbasis pecahan - Untuk itu digunakan metode rekonstruksi balik ke bentuk pecahan dengan memanfaatkan Stern–Brocot tree
- Nilai seperti
- Melalui cara ini, batas sesi, batas mingguan, dan satuan kredit yang sebenarnya dapat dipulihkan
Perbedaan struktur biaya antara langganan web dan API
- Pada langganan web Claude, meskipun konteks percakapan yang sama dirujuk berulang kali, tidak ada biaya input tambahan
- API harus mengirim ulang konteks yang sama pada setiap permintaan, dan bahkan saat cache hit, 10% biaya token input tetap ditagihkan
- Dalam pola penggunaan seperti coding berbasis agen yang berulang kali mengonsumsi konteks panjang, perbedaan biaya membesar dengan cepat
Batas nyata paket ‘Max 20x’
- Label ‘20x’ hanya berlaku untuk penggunaan per sesi 5 jam
- Batas penggunaan kumulatif mingguan dibatasi hanya sekitar 2x dibanding Max 5x
- Menguntungkan untuk penggunaan cepat dalam waktu singkat, tetapi kurang efisien untuk penggunaan berkelanjutan jangka panjang
Efisiensi nyata paket ‘Max 5x’
- Batas sesi meningkat hingga 6x dibanding Pro
- Batas mingguan naik hingga 8,3x dibanding Pro
- Terlihat sebagai paket yang memberikan kapasitas nyata lebih besar daripada namanya
- Pada harga $100 per bulan, terbentuk efisiensi biaya yang sangat unggul dibanding API
Kesimpulan efisiensi biaya
- Untuk coding jangka panjang dan pekerjaan pengembangan berbasis agen seperti Claude Code, langganan jauh lebih menguntungkan daripada API
- Khususnya, paket ‘Max 5x’ adalah titik dengan keseimbangan terbaik antara kecepatan, daya tahan, dan biaya
- Berdasarkan struktur saat ini, ini adalah pilihan optimal bagi pengguna tingkat lanjut dan developer
Tautan artikel asli: suspiciously precise floats, or, how I got Claude's real limits
Ringkasan komentar Reddit
- Secara umum, komentar menunjukkan persetujuan kuat bahwa analisis angka OP valid dari sisi perhitungan
- Secara khusus, opini mengerucut pada bahwa paket ‘Max 5x’ seharga $100/bulan memberikan value terbaik bagi heavy user
- Karena struktur penggunaan ulang cache konteks gratis di web UI, pada sesi panjang berbasis agen, selisih biaya dibanding API menjadi sangat besar
- Bahkan di antara pengguna Max 5x sendiri, banyak yang berbagi pengalaman bahwa mereka hampir tidak pernah menyentuh batas meski digunakan seharian
- Klaim bahwa ‘Max 20x adalah jebakan’ mendapat penjelasan tambahan
- Batas total penggunaan mingguan hanya sekitar 2x dibanding Max 5x
- Sebaliknya, batas sesi 5 jam meningkat 4x
- Karena itu, peran keduanya diringkas sebagai 20x untuk ledakan penggunaan singkat (sprint) dan 5x untuk penggunaan panjang berkelanjutan (maraton)
- Peringatan yang paling kuat disampaikan soal kurangnya transparansi dari Anthropic
- Seluruh analisis ini didasarkan pada angka hasil rekonstruksi balik
- Batas internal dapat berubah kapan saja tanpa pemberitahuan
- Berguna untuk optimasi biaya jangka pendek, tetapi ada konsensus bahwa berisiko jika dijadikan dasar keputusan bisnis jangka panjang
- Sebagai tips praktis yang paling berguna, cara memakai ekstensi Claude Code untuk VS Code banyak ditekankan
- Bisa login dengan akun langganan claude.ai alih-alih API key
- Dengan begitu, batas langganan bisa dipakai tanpa menghabiskan kredit API
- Banyak yang bereaksi bahwa mereka baru mengetahui fakta ini
- Sebagai poin tambahan, perbedaan privasi dan syarat layanan juga dibahas
- Web UI dan API memiliki Terms of Service yang berbeda
- Ada pandangan bahwa untuk pekerjaan kode yang sensitif atau proprietari, penggunaan API lebih aman
- Sebagai pendapat berlawanan, ada juga argumen bahwa batas penggunaan justru meningkatkan produktivitas
- Semakin mendekati tanpa batas, prompt cenderung menjadi panjang dan tidak efisien
- Batas dinilai memaksa desain prompt menjadi lebih rapi dan disengaja
- Secara keseluruhan, suasana komentar adalah
- “Untuk saat ini, Max 5x adalah pilihan optimal” sebagai konsensus yang realistis
- Sekaligus ada kewaspadaan bahwa “struktur ini bisa berubah kapan saja”
2 komentar
Karena saya menyalakan 8 agen sekaligus dan menjalankannya, batasnya cepat sekali kena.
Itu karena kamu belum terlalu banyak memakainya.... begitu mulai asyik pakai sana-sini, 20x juga langsung ludes~