30 poin oleh GN⁺ 14 hari lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Skill yang memaksa respons dalam gaya bahasa manusia gua untuk menghemat rata-rata 65~75% token output
  • Tingkat kompresi dapat diatur dalam tiga level: Lite·Full·Ultra, menghasilkan jawaban singkat dan efisien sambil tetap menjaga akurasi teknis
  • Dalam benchmark nyata, penjelasan terkait React·PostgreSQL·Git semuanya menurunkan penggunaan token hingga kurang dari setengahnya
  • Memberikan efek kecepatan respons sekitar 3x lebih cepat, keterbacaan yang lebih baik, dan penghematan biaya sekaligus
  • Bisa dipasang dengan perintah sederhana di Claude Code dan Codex, dan dapat terus digunakan sepanjang sesi

Ringkasan Caveman

  • Plugin untuk Claude Code dan Codex yang mengubah respons LLM menjadi ‘gaya bahasa manusia gua (caveman-speak)’ sehingga mengurangi penggunaan token sekitar 75%
  • Menghapus kata-kata yang tidak perlu sambil mempertahankan akurasi teknis untuk menghasilkan jawaban singkat dan efisien
  • Instalasi bisa dilakukan dengan perintah satu baris, dan tetap aktif di semua sesi
  • Hanya token output yang dikurangi — token berpikir/penalaran tidak terpengaruh
  • Yang dihapus meliputi:
    • Salam/pembuka: "Sure, I'd be happy to help" (membuang 8 token)
    • Pembuka penjelasan alasan: "The reason this is happening is because" (7 token)
    • Ekspresi rekomendasi: "I would recommend that you consider" (7 token)
    • Kalimat pembuka bertele-tele: "Sure, let me take a look at that for you" (10 token)
  • Yang dipertahankan: code block, istilah teknis (seperti polymorphism), pesan error, pesan commit git·PR

Contoh Before / After

  • Penjelasan teknis yang sama dipadatkan menjadi kalimat singkat
    • Penjelasan penyebab re-render komponen React: 69 token → 19 token
    • Penjelasan bug middleware autentikasi: penghematan token lebih dari 75%
  • Tingkat kompresi bisa diatur dalam tiga level: Lite / Full / Ultra
    • Lite (/caveman lite): menghapus ekspresi yang tidak perlu, tata bahasa tetap dipertahankan — tetap profesional tanpa bertele-tele
    • Full (/caveman full): mode caveman dasar — artikel dihilangkan, kalimat pendek dan terputus-putus
    • Ultra (/caveman ultra): kompresi maksimum — gaya telegraf, semuanya dipersingkat

Benchmark

  • Hasil perbandingan penggunaan token nyata melalui Claude API menunjukkan rata-rata penghematan 65%
  • Rentang penghematan: 22%~87%
    • Penjelasan bug re-render React: 1,180 → 159 token (hemat 87%)
    • Pengaturan connection pool PostgreSQL: 2,347 → 380 token (hemat 84%)
    • Docker multi-stage build: 1,042 → 290 token (hemat 72%)
    • Penjelasan git rebase vs merge: 702 → 292 token (hemat 58%)
    • Refaktorisasi callback → async/await: 387 → 301 token (hemat 22%, efek paling kecil)
  • Hanya token output yang berkurang, token berpikir·penalaran tetap sama
  • Manfaat utamanya adalah keterbacaan yang lebih baik dan kecepatan respons yang meningkat, sedangkan penghematan biaya adalah efek tambahan

Dasar ilmiah

  • Makalah Maret 2026 "Brevity Constraints Reverse Performance Hierarchies in Language Models": ketika model besar dipaksa memberi respons singkat, ditemukan peningkatan akurasi 26%p pada benchmark tertentu dan pembalikan peringkat performa
  • "Verbose not always better. Sometimes less word = more correct"
    • Dibanding respons panjang, ada kasus di mana respons singkat justru lebih akurat

Cara instalasi

  • Instalasi satu baris: npx skills add JuliusBrussee/caveman
  • Plugin Claude Code: claude plugin marketplace add JuliusBrussee/caveman
  • Codex: clone repositori lalu cari dan pasang Caveman di menu /plugins
  • Pemicu: /caveman, "talk like caveman", "caveman mode", "less tokens please"
  • Menonaktifkan: "stop caveman" atau "normal mode"
  • Sekali instal → berlaku untuk seluruh sesi berikutnya

Cara penggunaan

  • Perintah pemicu: /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”

  • Perintah berhenti: “stop caveman”, “normal mode”

  • Pengaturan level

    Level Trigger Karakteristik
    Lite /caveman lite Tata bahasa dipertahankan, kata-kata tidak perlu dihapus
    Full /caveman full Mode dasar, artikel dan kata mubazir dihapus
    Ultra /caveman ultra Kompresi maksimum, ekspresi berpusat pada singkatan
  • Pengaturan dipertahankan sampai sesi berakhir

  • Lisensi MIT / Python 100% / Mendukung plugin Claude Code & Codex

Belum ada komentar.

Belum ada komentar.