Context Mode - Server MCP yang menghemat 98% jendela konteks agen coding AI

xguru · 2026-05-03T09:31:02+09:00

Menghemat data mentah yang membanjiri jendela konteks saat pemanggilan alat MCP, dan memperpanjang durasi sesi dari ~30 menit menjadi ~3 jam Penghematan konteks: mengisolasi data mentah ke sandbox sehingga berkurang 98% dari 315KB → 5.4KB Kontinuitas sesi: menyimpan dan mengindeks semua event seperti pengeditan file, pekerjaan git, tugas, error, dan keputusan pengguna ke SQLite+FTS5, lalu menelusurinya dengan BM25 untuk pelacakan event sesi dan pemulihan setelah kompaksi Berpikir dengan kode: alih-alih LLM membaca data secara langsung, LLM menulis skrip dan hanya mengembalikan hasilnya (misalnya saat menghitung jumlah fungsi, menulis kode terkait tanpa menyimpan konteks lalu hanya mengambil hasil aktual) Kompresi output: pengurangan token output ~65-75% dengan tetap mempertahankan akurasi teknis Mendukung 14 platform: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, dan lainnya Dukungan tingkat kontinuitas sesi dibedakan menurut level hook tiap platform seperti PreToolUse, PostToolUse, SessionStart, dan PreCompact Menyediakan 11 alat MCP: ctx_execute (11 runtime bahasa), ctx_batch_execute (eksekusi batch untuk banyak perintah+pencarian), ctx_execute_file (pemrosesan sandbox file), ctx_index/ctx_search (pengindeksan dan pencarian basis pengetahuan berbasis FTS5+BM25), ctx_fetch_and_index (fetch URL, pengindeksan, dan cache TTL 24 jam), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight Keamanan: pengaturan permissions Claude Code (pola deny/allow) diterapkan sama pada sandbox MCP, dan perintah yang dirangkai juga diperiksa secara terpisah satu per satu Berjalan sepenuhnya lokal: tanpa telemetri, sinkronisasi cloud, atau pelacakan penggunaan; DB SQLite disimpan di direktori home Sudah digunakan oleh tim di perusahaan besar seperti Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, dan Datadog Elastic License 2.0 (source-available, dilarang menyediakan sebagai layanan hosting)

Menghemat data mentah yang membanjiri jendela konteks saat pemanggilan alat MCP, dan memperpanjang durasi sesi dari ~30 menit menjadi ~3 jam
Penghematan konteks: mengisolasi data mentah ke sandbox sehingga berkurang 98% dari 315KB → 5.4KB
Kontinuitas sesi: menyimpan dan mengindeks semua event seperti pengeditan file, pekerjaan git, tugas, error, dan keputusan pengguna ke SQLite+FTS5, lalu menelusurinya dengan BM25 untuk pelacakan event sesi dan pemulihan setelah kompaksi
Berpikir dengan kode: alih-alih LLM membaca data secara langsung, LLM menulis skrip dan hanya mengembalikan hasilnya (misalnya saat menghitung jumlah fungsi, menulis kode terkait tanpa menyimpan konteks lalu hanya mengambil hasil aktual)
Kompresi output: pengurangan token output ~65-75% dengan tetap mempertahankan akurasi teknis
Mendukung 14 platform: Claude Code (plugin marketplace), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity, dan lainnya
- Dukungan tingkat kontinuitas sesi dibedakan menurut level hook tiap platform seperti PreToolUse, PostToolUse, SessionStart, dan PreCompact
Menyediakan 11 alat MCP: ctx_execute (11 runtime bahasa), ctx_batch_execute (eksekusi batch untuk banyak perintah+pencarian), ctx_execute_file (pemrosesan sandbox file), ctx_index/ctx_search (pengindeksan dan pencarian basis pengetahuan berbasis FTS5+BM25), ctx_fetch_and_index (fetch URL, pengindeksan, dan cache TTL 24 jam), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
Keamanan: pengaturan permissions Claude Code (pola deny/allow) diterapkan sama pada sandbox MCP, dan perintah yang dirangkai juga diperiksa secara terpisah satu per satu
Berjalan sepenuhnya lokal: tanpa telemetri, sinkronisasi cloud, atau pelacakan penggunaan; DB SQLite disimpan di direktori home
Sudah digunakan oleh tim di perusahaan besar seperti Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, dan Datadog
Elastic License 2.0 (source-available, dilarang menyediakan sebagai layanan hosting)

8 komentar

kirkyoon 2026-05-06

Saya rasa memang terasa. Saya hanya memakai MCP dan sedang mengecualikan hook.

kaydash 2026-05-04

Apakah berjalan dengan baik..

duse0001 2026-05-03

Rasanya seperti campuran antara Claude mem dan caveman.

recast7838 2026-05-03

Belakangan ini sepertinya produk atau prompt dengan gaya “menghemat token” sedang ngetren. Saya tidak tahu apakah itu benar-benar efektif secara praktis.

kurthong 2026-05-04

Menurut saya, penghematan token dan penghematan context window itu saling tumpang tindih, tetapi bukan hal yang sama.

Penghematan token adalah soal biaya, sedangkan penghematan context window adalah soal kualitas memori kerja model. Jika log dalam jumlah besar atau DOM snapshot dimasukkan begitu saja, biayanya memang naik, tetapi masalah yang lebih besar adalah kemungkinan model melewatkan petunjuk penting di tengah noise atau merujuknya secara keliru menjadi lebih tinggi.

Tampaknya lebih tepat memahami context-mode sebagai alat yang lebih dekat ke "mengendalikan apa yang akan dimasukkan ke dalam konteks" daripada sekadar "menggunakan sesedikit mungkin".

ehlegeth 2026-05-04

Anda perlu membedakan antara penghematan token dan penghematan context window.
Karena keduanya sering dibahas bersama, memang mudah membingungkannya.

shakespeares 2026-05-03

Benar juga, saya kurang yakin seberapa praktis ini.. Rasanya kalau dipakai satu-dua kali lagi malah akan memakai lebih banyak token..

kyg5474 2026-05-03

Benarkah?

Context Mode - Server MCP yang menghemat 98% jendela konteks agen coding AI

Bacaan terkait

8 komentar