23 poin oleh xguru 2026-05-03 | 8 komentar | Bagikan ke WhatsApp
  • Menghemat data mentah yang membanjiri jendela konteks saat pemanggilan alat MCP, dan memperpanjang durasi sesi dari ~30 menit menjadi ~3 jam
  • Penghematan konteks: mengisolasi data mentah ke sandbox sehingga berkurang 98% dari 315KB → 5.4KB
  • Kontinuitas sesi: menyimpan dan mengindeks semua event seperti pengeditan file, pekerjaan git, tugas, error, dan keputusan pengguna ke SQLite+FTS5, lalu menelusurinya dengan BM25 untuk pelacakan event sesi dan pemulihan setelah kompaksi
  • Berpikir dengan kode: alih-alih LLM membaca data secara langsung, LLM menulis skrip dan hanya mengembalikan hasilnya (misalnya saat menghitung jumlah fungsi, menulis kode terkait tanpa menyimpan konteks lalu hanya mengambil hasil aktual)
  • Kompresi output: pengurangan token output ~65-75% dengan tetap mempertahankan akurasi teknis
  • Mendukung 14 platform: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, dan lainnya
    • Dukungan tingkat kontinuitas sesi dibedakan menurut level hook tiap platform seperti PreToolUse, PostToolUse, SessionStart, dan PreCompact
  • Menyediakan 11 alat MCP: ctx_execute (11 runtime bahasa), ctx_batch_execute (eksekusi batch untuk banyak perintah+pencarian), ctx_execute_file (pemrosesan sandbox file), ctx_index/ctx_search (pengindeksan dan pencarian basis pengetahuan berbasis FTS5+BM25), ctx_fetch_and_index (fetch URL, pengindeksan, dan cache TTL 24 jam), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
  • Keamanan: pengaturan permissions Claude Code (pola deny/allow) diterapkan sama pada sandbox MCP, dan perintah yang dirangkai juga diperiksa secara terpisah satu per satu
  • Berjalan sepenuhnya lokal: tanpa telemetri, sinkronisasi cloud, atau pelacakan penggunaan; DB SQLite disimpan di direktori home
  • Sudah digunakan oleh tim di perusahaan besar seperti Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, dan Datadog
  • Elastic License 2.0 (source-available, dilarang menyediakan sebagai layanan hosting)

8 komentar

 
kirkyoon 2026-05-06

Saya rasa memang terasa. Saya hanya memakai MCP dan sedang mengecualikan hook.

 
kaydash 2026-05-04

Apakah berjalan dengan baik..

 
duse0001 2026-05-03

Rasanya seperti campuran antara Claude mem dan caveman.

 
recast7838 2026-05-03

Belakangan ini sepertinya produk atau prompt dengan gaya “menghemat token” sedang ngetren. Saya tidak tahu apakah itu benar-benar efektif secara praktis.

 
kurthong 2026-05-04

Menurut saya, penghematan token dan penghematan context window itu saling tumpang tindih, tetapi bukan hal yang sama.

Penghematan token adalah soal biaya, sedangkan penghematan context window adalah soal kualitas memori kerja model. Jika log dalam jumlah besar atau DOM snapshot dimasukkan begitu saja, biayanya memang naik, tetapi masalah yang lebih besar adalah kemungkinan model melewatkan petunjuk penting di tengah noise atau merujuknya secara keliru menjadi lebih tinggi.

Tampaknya lebih tepat memahami context-mode sebagai alat yang lebih dekat ke "mengendalikan apa yang akan dimasukkan ke dalam konteks" daripada sekadar "menggunakan sesedikit mungkin".

 
ehlegeth 2026-05-04

Anda perlu membedakan antara penghematan token dan penghematan context window.
Karena keduanya sering dibahas bersama, memang mudah membingungkannya.

 
shakespeares 2026-05-03

Benar juga, saya kurang yakin seberapa praktis ini.. Rasanya kalau dipakai satu-dua kali lagi malah akan memakai lebih banyak token..

 
kyg5474 2026-05-03

Benarkah?