rtk - Proksi CLI yang Mengurangi Konsumsi Token LLM hingga 60~90%
(github.com/rtk-ai)- Biner Rust tunggal (Windows/macOS/Linux) yang memfilter dan mengompresi output perintah CLI yang dijalankan alat coding AI sebelum diteruskan ke LLM, sehingga menghemat token 60~90%
- Mendukung lebih dari 100 perintah seperti git, grep, ls, cargo test, dll., dan menerapkan empat strategi sebelum output perintah dikirim ke konteks LLM: pemfilteran cerdas, pengelompokan, pemotongan, dan penghapusan duplikasi
- Mendukung 10 alat coding AI seperti Claude Code, Codex, Cursor, Gemini CLI, dan saat hook dipasang, perintah bash secara otomatis ditulis ulang secara transparan menjadi perintah yang sama melalui rtk
- Hook ini hanya berlaku untuk pemanggilan alat Bash; alat bawaan Claude Code seperti
Read,Grep,Glob, dll. melewati hooking ini, jadi untuk menerapkan pemfilteran RTK Anda perlu menggunakan perintah shell atau perintah rtk secara eksplisit
- Hook ini hanya berlaku untuk pemanggilan alat Bash; alat bawaan Claude Code seperti
- Perkiraan penghematan untuk sesi Claude Code 30 menit adalah ~23.900 token (sekitar penghematan 80%) dibandingkan standar ~118.000 token
- Pada test runner seperti
cargo test/npm test,pytest,go test, dll., penghematan bisa mencapai 90%
- Pada test runner seperti
- Cara memulai
# 1. Instal rtk init -g # Claude Code / Copilot (default) rtk init -g --gemini # Gemini CLI rtk init -g --codex # Codex (OpenAI) rtk init -g --agent cursor # Cursor # 2. Setelah itu, restart alat AI git status # sekarang berjalan sebagai rtk git status - Lisensi Apache-2.0
9 komentar
Pada akhirnya ini adalah trade-off dengan kualitas, dan saya juga khawatir jangan-jangan strukturnya malah jadi menggunakan lebih banyak token untuk memulihkan kualitas yang hilang.
Saya pernah mencobanya sebelumnya, tetapi saya menghapusnya karena Claude terus menghabiskan lebih banyak token untuk menyelesaikan masalah yang disebabkan oleh rtk.
(Misalnya, saat mengirim permintaan JSON dengan
curl, ia menghasilkan JSON yang tidak valid sehinggajqmemunculkan error, lalu Claude melakukan debugging dan menghabiskan token, dan pada akhirnya kembali menerima permintaancurlmentah lalu mem-parsing-nya denganjq.)Meski begitu, saya pikir niat di baliknya sendiri adalah sebuah upaya yang bagus, jadi kalau nanti sudah lebih stabil sepertinya layak untuk dicoba.
Saya tidak tahu apakah ini benar-benar menguranginya. Saya sudah bilang ke agent untuk terus memakai perintah
rtk ls.., tapi tetap tidak dipakai.Saya pribadi juga sedang mencobanya.. tetapi karena kompresi rtk, ada juga kasus di mana Claude Code tidak bisa memperoleh konteks yang dibutuhkan dari hasil perintah, jadi sepertinya ini bergantung pada kasusnya.
Saya juga merasa itu cukup disayangkan pada bagian tersebut!
Baru-baru ini ada pembaruan yang menyimpan full output ke file terpisah sehingga LLM bisa membacanya saat diperlukan~
Sepertinya ada sedikit efek samping pada kasus penggunaan pengguna lain.
Semoga bisa segera diatasi dan diterapkan dengan baik.
https://reddit.com/r/ClaudeCode/…
Kalau benar bisa menguranginya dengan baik, sepertinya akan sangat bagus!
Idenya bagus.
Namun, karena pelatihannya kemungkinan didasarkan pada output CLI umum, saya agak khawatir apakah kalau dipadatkan seperti ini hasil output-nya masih akan keluar sebaik sebelumnya.
Saya akan coba pakai.
Sepertinya perlu dibandingkan juga dengan contextmode...