DeepSeek Reasonix - Agen coding native DeepSeek dengan caching tinggi dan biaya rendah

(esengine.github.io)

3 poin oleh GN⁺ 2026-05-25 | 2 komentar | Bagikan ke WhatsApp

Agen coding terminal open-source yang dirancang khusus untuk DeepSeek API, berkomunikasi langsung dengan api.deepseek.com
Loop append-only dioptimalkan untuk byte-stable prefix cache milik DeepSeek, sehingga pada sesi panjang dapat mempertahankan cache hit rate di atas 90% dan menurunkan biaya token input hingga sekitar 1/5 (sekitar 1/3 biaya dibanding alat sejenis)
Dapat dijalankan hanya dengan satu baris npx reasonix code tanpa perlu instalasi global (Node ≥ 22, mendukung macOS/Linux/Windows)
3 desain inti
- Cache-First Loop: struktur append-only, tanpa ketergantungan marker, mempertahankan prefix cache dengan urutan pemanggilan deterministik
- R1 Thought Harvest: mengumpulkan rantai penalaran dari tool call yang terlewat
- Tool-Call Repair: pemulihan dengan metode self-heal yang sadar skema
Prinsip terminal-first sehingga tidak mendukung plugin IDE, dan langsung memanfaatkan alat terminal seperti git diff dan ls
- Berbasis TypeScript + Ink TUI, juga menyediakan klien desktop Tauri terpisah (dengan bundel runtime Node)
Operasi model V4 two-tier: default ke V4-Flash untuk iterasi berbiaya rendah, promosi satu giliran ke V4-Pro dengan /pro, dan menjalankan seluruh sesi di Pro dengan /preset max
Dukungan kelas satu untuk MCP(Model Context Protocol): menghubungkan server eksternal dengan satu baris --mcp "name=cmd args", mendukung metode transport stdio, SSE, dan Streamable HTTP
Sandbox + gerbang /plan: semua alat bawaan di-sandbox ke direktori eksekusi, mode /plan menjadi read-only audit gate yang memblokir penulisan sebelum persetujuan
- Pengeditan SEARCH/REPLACE menunggu di pending queue dan tidak diterapkan ke disk sampai /apply
Composable Skills: letakkan file Markdown di .reasonix/skills/<name>.md, lalu gunakan frontmatter runAs: subagent dan allowed-tools untuk eksekusi terisolasi
Replay & Events: semua event dicatat ke disk sehingga sesi lama dapat diputar ulang, dianalisis statistiknya, dan diaudit dengan perintah reasonix replay / events / stats
Ekstensibilitas berbasis plain text: semua konfigurasi dikelola sebagai plain text yang bisa dilacak dengan git melalui direktori /mcp, /skills, /memory, /config, dan /slash
Mendukung endpoint DeepSeek self-hosted: sejak 0.30 mengizinkan prefix key nonstandar, dan cukup set baseUrl ke alamat internal agar loop, cache, dan protokol tool tetap bekerja sama
Harga DeepSeek API: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
Lisensi MIT

2 komentar

myoun 2026-05-25

DeepSeek yang menjadikan diskon harga V4 Pro permanen kalau dipikir-pikir, menggunakan DeepSeek sebagai agen coding sepertinya bukan pilihan yang buruk

GN⁺ 2026-05-25

Komentar Hacker News

Saya tidak yakin benar-benar perlu agen coding khusus DeepSeek untuk memanfaatkan cache DeepSeek
Kemarin kuota Codex saya masih bermasalah, jadi saya membuat bridge yang sangat kecil untuk memakai DeepSeek V4 Pro di Codex, dan tampaknya hampir semua yang saya kerjakan terkena cache: https://i.imgur.com/7eKn6wN.png
Per 2026-05-23, tercatat 39,123,200 token cache hit untuk input dan 1,692,286 token cache miss, dan bridge itu tidak melakukan hal khusus selain menyesuaikan format API DeepSeek ke bentuk yang diharapkan Codex, jadi sama sekali tidak ada penanganan khusus terkait caching
Selain kemungkinan cache yang lebih baik, saya tidak begitu paham apa kelebihannya dibanding menjalankan OpenCode langsung dengan API DeepSeek. Itu juga seharusnya mendapatkan caching yang mirip, berkomunikasi langsung dengan api.deepseek.com bila itu penting, dan memberi lingkungan eksekusi yang jauh lebih matang
- Sepertinya lebih baik menautkan halaman ini: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  Di situ dijelaskan mengapa ini dianggap solusi yang lebih baik, dan mengapa ada filosofi desain yang kuat seperti itu
  “Caching awalan otomatis hanya aktif ketika awalan byte persis dari permintaan sebelumnya cocok. Kebanyakan loop agen mengubah urutan, menulis ulang, atau menyuntikkan timestamp baru di setiap giliran — tingkat cache hit nyata di bawah 20%”
  Jadi bagian ini dan teknik lainnya dioptimalkan untuk meningkatkan cache hit rate dan menurunkan biaya
- OpenCode punya masalah stabilitas cache yang cukup parah, dan saat ini tampaknya tidak terlalu berniat memperbaikinya
- Saya juga langsung berpikir hal yang sama, dan setelah melihat kode provider DeepSeek di agen coding yang saya pakai, hampir semua yang ditulis penulis ternyata sudah diimplementasikan
  Buat yang penasaran: http://github.com/tontinton/maki
- Kalau Anda “membuat bridge kecil untuk memakai DeepSeek V4 Pro di Codex”, saya penasaran apakah Anda bisa membagikan bridge itu
  DeepSeek v4 sangat bagus bila dipakai dengan claude-code atau opencode. Dalam kasus saya, claude code menghabiskan biaya lebih sedikit daripada opencode, mungkin karena lingkungan eksekusinya dirancang lebih baik
- Ini terlihat seperti terpasang native ke terminal. Artinya, sepertinya tidak ada aplikasi terpisah yang menjalankan atau membungkus agen di dalam TUI
  Jadi pada akhirnya ini tampaknya memakai kalimat bahasa Inggris biasa alih-alih perintah
Situs web ini terlihat seperti dibuat oleh Codex. Saya pernah meminta Codex membuat HTML ikhtisar fitur untuk tim, lalu yang keluar adalah monster yang terlalu dihias, dengan kotak statistik besar yang hampir tidak berisi informasi bermakna, dan bahkan font, warna, layout, sampai hero section-nya sangat mirip
Sama seperti situs ini, tampilannya juga mengerikan di mobile. Pada akhirnya saya meminta Claude membuat file HTML satu halaman, dan sekitar 95% hasilnya bisa langsung dipakai untuk menjelaskan maksud dengan jelas, hanya perlu sedikit penyesuaian
- Banyak desain berbasis LLM belakangan memang terlihat seperti ini. Saya tidak tahu kenapa orang tidak merasa kombinasi font serif yang sangat miring itu jelek
  Di mobile, contoh kode terus mendorong konten lain keluar, sehingga sebagian besar halaman jadi sulit dibaca. Tentu ini mungkin penilaian yang terlalu keras dan niatnya bagus, tapi situs yang lebih sederhana seharusnya sudah cukup
- Ucapan “Claude membuat file HTML satu halaman dan 95% hasilnya bisa langsung dipakai” sendiri tidak banyak mengatakan apa pun tentang model mana pun
  Seperti yang diketahui semua software engineer, menghapus fitur bisa membuat proyek apa pun jadi jauh lebih sederhana
Yang saya harap penulis pahami adalah, ada orang yang menginginkan binary tunggal yang self-contained yang tidak memakan setengah memori komputer, dan karena itu ingin menulisnya dalam Rust atau Go
- Saya sangat senang makin banyak software baru ditulis dalam Rust, Go, dan Zig
  Nilai dan kenyamanan pengembangan yang dulu diberikan bahasa interpreter yang lambat makin memudar. Bahasa-bahasa baru sudah membawa hal-hal bagus sebagai default, atau lebih tepatnya mungkin alarm panggilan jam 1 pagi mulai membuat kita kesal
- Terlepas dari penggunaan AI dan segala klaimnya, saya penasaran apakah ada yang bisa menjelaskan kenapa misalnya kita tidak bisa membuat agen coding dalam Go murni
  Go sudah punya banyak library terminal yang bagus
- Kalau Anda ingin mencoba binary tunggal self-contained yang memakan lebih dari setengah memori komputer, ada juga ds4-agent
- Khususnya di era agen coding, kalau memang menginginkan itu, bukankah tinggal membuatnya sendiri saja?
- Membuat bot coding sambil justru menghindari coding sendiri rasanya mengatakan sesuatu
Saya tidak suka halaman itu. Karena animasi mengetik, ukuran area contoh terus berubah, dan konten di bawahnya terdorong naik turun
Itu pengalaman pengguna yang sangat buruk
- Mau ada agen atau tidak, orang tetap harus menguji situs web di berbagai resolusi atau setidaknya berbagai lebar jendela
  Tapi rasanya ini makin menjadi keterampilan yang hilang
- Terlihat seperti sampah AI desain buatan Claude
Dari sudut pandang seseorang yang sudah setahun membangun lingkungan eksekusi, orang-orang opencode itu bukan bodoh sampai merusak cache awalan
Biasanya mereka sengaja melakukannya karena setelah diuji hasil keseluruhannya memang lebih baik
Jika Anda merasa dsv4 cukup berbeda dari perilaku rata-rata model lain, kirim saja PR ke lingkungan eksekusi yang Anda inginkan dengan penanganan pengecualian spesifik beserta alasannya. Mengasumsikan secara membabi buta bahwa “demi cache semuanya harus append-only” hanya membuang waktu semua orang
Ini bukan agen yang dibuat DeepSeek, jadi judulnya menyesatkan
Sekarang merek DeepSeek sudah cukup kuat, sampai orang-orang mulai ingin menumpang pada pengenalan merek itu
Cukup menarik. Saya berlangganan Claude seharga 200 dolar per bulan, dan sejauh ini hampir tidak pernah perlu memakai yang lain
Tapi makin Claude membatasi alur kerja saya, terutama setelah perubahan terbaru pada penggunaan IDE/-p, makin saya ingin pindah ke tempat lain
Saya memang sangat menginginkan kemampuan reasoning terdepan, jadi agak khawatir, tapi saya tetap tertarik pada DeepSeek
- Kalau Anda ingin reasoning terdepan, sebaiknya coba juga model lain dan lihat sendiri seberapa besar bedanya dengan model papan atas
  Saya melakukannya dan sadar bahwa Qwen-2.5-Max saja sudah cukup untuk saya. Untuk pekerjaan main-main yang saya tangani, saya rasa Claude Sonnet 3.5 pun sudah cukup. Saya bukan sedang memburu Fields Medal matematika
- Hari ini saya memberi tugas rekayasa balik yang cukup rumit ke DS-4 xhigh dan GPT-5.5 xhigh
  Sekitar 6 jam kemudian, keduanya gagal melakukan reverse engineering sepenuhnya, tetapi perbedaannya besar
  DS berhenti tiap 30 menit sambil berkata sudah menyelesaikan reverse engineering sepenuhnya dan sekarang semuanya akan berjalan, padahal nyatanya bahkan 1% pun belum selesai. Saya sudah memberi instruksi keras agar tidak memakai jalan pintas tertentu, tapi ia tetap terus mencarinya, dan hasilnya gagal total
  Sebaliknya, GPT-5.5 benar-benar mengesankan. Ia melakukan apa yang seharusnya dikerjakan, menyelesaikan lapisan awal, dan tidak lanjut ke tahap berikutnya sebelum yakin sudah sepenuhnya memahami apa yang diperlukan. Selama 6 jam itu saya hanya memberi prompt ketika saya melihat ia bergerak ke arah yang benar dan ingin mengarahkannya sedikit dengan cara yang lebih baik. Tidak terasa seperti sedang bertarung melawannya
  Memang setelah kompresi kadang ia tiba-tiba berkata semacam “saya tidak bisa membantu reverse engineering”, tetapi di sesi baru itu beres dengan rapi
  Saya sudah membatalkan langganan Claude sebulan lalu jadi tidak bisa membandingkan, tetapi DeepSeek sangat mengingatkan saya pada pengalaman bekerja dengan Opus 4.6/4.7. Mungkin bagi sebagian orang itu sinyal positif, tetapi setelah melihat GPT-5.5, cara kerja ala Claude/DS terasa terlalu menjengkelkan
- Sebaiknya tetap pakai paket 200 dolar per bulan, dan jangan coba paket coding 10 dolar dengan model open-weight dan limit lebih tinggi
  Anthropic butuh uang Anda untuk bertahan hidup, dan Anda akan tidur lebih nyenyak karena merasa sedang memakai yang tercanggih
- Daripada meninggalkan model Anthropic sepenuhnya, Anda juga bisa tetap memakainya untuk beberapa tugas seperti perencanaan, lalu menyerahkan implementasinya ke DeepSeek atau yang sejenis
  Bahkan dengan alat yang berbeda, dokumen rencana Markdown bekerja cukup baik. Kalau saya turun dari langganan 5x Max ke Pro, itulah yang akan saya lakukan
  Saya juga sedang membuat launcher yang memudahkan penggunaan provider pihak ketiga di Claude Code: https://ccode.kronis.dev
  Proxy lokalnya sudah berjalan, hanya pergantian model dinamis yang belum ada. Sepertinya tidak terlalu sulit untuk ditambahkan, dan tergantung jadwal, kemungkinan masuk dalam 1–2 minggu
  Saya rasa tidak bijak untuk sepenuhnya meninggalkan Anthropic. Modelnya sangat bagus, dan dengan berlangganan saya juga mendapat fitur seperti Remote Control yang saya sukai. Namun mengganti tier untuk sedikit menghemat uang tampaknya masuk akal. Di sisi lain, tetap perlu baseline kualitas. Dulu saat saya memakai GLM 4.6 di Cerebras, hasil yang sembrono cukup sering muncul
- Kalau Anda ingin reasoning terdepan, Anda harus memakai GPT 5.5 Pro
Saya suka fokusnya pada efisiensi cache hit. Salut untuk tim DeepSeek karena telah membuat produk hebat yang memaksimalkan efisiensi biaya bagi pengguna
- Saya sudah memakainya beberapa waktu dan sepenuhnya setuju. Menurut saya ini sebagus Codex atau Claude yang saya pakai berdampingan
  Di skenario yang sensitif biaya, ini pemenangnya, dan kalau ada startup yang bisa mengemasnya dengan baik sambil memperhatikan retensi data, ini bisa menjadi produk bagus untuk dijual ke perusahaan. Karena isu utama untuk asisten coding adalah retensi data dan privasi
- Sekadar mengingatkan, proyek ini adalah side project seseorang
  “Proyek open source independen · tidak berafiliasi dengan DeepSeek”
- Ditambah biaya API yang memang sudah murah, mungkin Anda bahkan bisa menjalankan pekerjaan yang sama selama berhari-hari
- Saya tidak paham bagaimana efisiensi cache hit itu bisa dimungkinkan. Bukankah ini cuma soal tidak mengubah konteks sebelumnya?
  Saya tidak mengerti tuas apa yang sebenarnya bisa disetel di sini
Saya mencobanya dan area input teksnya berlatar hitam dengan font gelap
Saya memeriksa dokumentasi dan meminta bantuan font/gaya ke DeepSeek v4, Claude, dan Gemini, tetapi tidak ada yang berhasil selain menjalankannya di terminal bertema gelap. Gila. Apa para pengembang proyek ini tidak ada yang memakai tema terang?
- Saya setuju itu masalah, tapi mungkin memang benar-benar hampir tidak ada yang memakainya
  Tema terang memang sangat jarang digunakan

DeepSeek Reasonix - Agen coding native DeepSeek dengan caching tinggi dan biaya rendah

Bacaan terkait

2 komentar

Komentar Hacker News