1 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Agen coding terminal open-source yang dirancang khusus untuk DeepSeek API, berkomunikasi langsung dengan api.deepseek.com
  • Loop append-only dioptimalkan untuk byte-stable prefix cache milik DeepSeek, sehingga pada sesi panjang dapat mempertahankan cache hit rate di atas 90% dan menurunkan biaya token input hingga sekitar 1/5 (sekitar 1/3 biaya dibanding alat sejenis)
  • Dapat dijalankan hanya dengan satu baris npx reasonix code tanpa perlu instalasi global (Node ≥ 22, mendukung macOS/Linux/Windows)
  • 3 desain inti
    • Cache-First Loop: struktur append-only, tanpa ketergantungan marker, mempertahankan prefix cache dengan urutan pemanggilan deterministik
    • R1 Thought Harvest: mengumpulkan rantai penalaran dari tool call yang terlewat
    • Tool-Call Repair: pemulihan dengan metode self-heal yang sadar skema
  • Prinsip terminal-first sehingga tidak mendukung plugin IDE, dan langsung memanfaatkan alat terminal seperti git diff dan ls
    • Berbasis TypeScript + Ink TUI, juga menyediakan klien desktop Tauri terpisah (dengan bundel runtime Node)
  • Operasi model V4 two-tier: default ke V4-Flash untuk iterasi berbiaya rendah, promosi satu giliran ke V4-Pro dengan /pro, dan menjalankan seluruh sesi di Pro dengan /preset max
  • Dukungan kelas satu untuk MCP(Model Context Protocol): menghubungkan server eksternal dengan satu baris --mcp "name=cmd args", mendukung metode transport stdio, SSE, dan Streamable HTTP
  • Sandbox + gerbang /plan: semua alat bawaan di-sandbox ke direktori eksekusi, mode /plan menjadi read-only audit gate yang memblokir penulisan sebelum persetujuan
    • Pengeditan SEARCH/REPLACE menunggu di pending queue dan tidak diterapkan ke disk sampai /apply
  • Composable Skills: letakkan file Markdown di .reasonix/skills/<name>.md, lalu gunakan frontmatter runAs: subagent dan allowed-tools untuk eksekusi terisolasi
  • Replay & Events: semua event dicatat ke disk sehingga sesi lama dapat diputar ulang, dianalisis statistiknya, dan diaudit dengan perintah reasonix replay / events / stats
  • Ekstensibilitas berbasis plain text: semua konfigurasi dikelola sebagai plain text yang bisa dilacak dengan git melalui direktori /mcp, /skills, /memory, /config, dan /slash
  • Mendukung endpoint DeepSeek self-hosted: sejak 0.30 mengizinkan prefix key nonstandar, dan cukup set baseUrl ke alamat internal agar loop, cache, dan protokol tool tetap bekerja sama
  • Harga DeepSeek API: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
  • Lisensi MIT

1 komentar

 
GN⁺ 4 jam lalu
Komentar Hacker News
  • Saya tidak yakin benar-benar perlu agen coding khusus DeepSeek untuk memanfaatkan cache DeepSeek
    Kemarin kuota Codex saya masih bermasalah, jadi saya membuat bridge yang sangat kecil untuk memakai DeepSeek V4 Pro di Codex, dan tampaknya hampir semua yang saya kerjakan terkena cache: https://i.imgur.com/7eKn6wN.png
    Per 2026-05-23, tercatat 39,123,200 token cache hit untuk input dan 1,692,286 token cache miss, dan bridge itu tidak melakukan hal khusus selain menyesuaikan format API DeepSeek ke bentuk yang diharapkan Codex, jadi sama sekali tidak ada penanganan khusus terkait caching
    Selain kemungkinan cache yang lebih baik, saya tidak begitu paham apa kelebihannya dibanding menjalankan OpenCode langsung dengan API DeepSeek. Itu juga seharusnya mendapatkan caching yang mirip, berkomunikasi langsung dengan api.deepseek.com bila itu penting, dan memberi lingkungan eksekusi yang jauh lebih matang

    • Sepertinya lebih baik menautkan halaman ini: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
      Di situ dijelaskan mengapa ini dianggap solusi yang lebih baik, dan mengapa ada filosofi desain yang kuat seperti itu
      “Caching awalan otomatis hanya aktif ketika awalan byte persis dari permintaan sebelumnya cocok. Kebanyakan loop agen mengubah urutan, menulis ulang, atau menyuntikkan timestamp baru di setiap giliran — tingkat cache hit nyata di bawah 20%”
      Jadi bagian ini dan teknik lainnya dioptimalkan untuk meningkatkan cache hit rate dan menurunkan biaya
    • OpenCode punya masalah stabilitas cache yang cukup parah, dan saat ini tampaknya tidak terlalu berniat memperbaikinya
    • Saya juga langsung berpikir hal yang sama, dan setelah melihat kode provider DeepSeek di agen coding yang saya pakai, hampir semua yang ditulis penulis ternyata sudah diimplementasikan
      Buat yang penasaran: http://github.com/tontinton/maki
    • Kalau Anda “membuat bridge kecil untuk memakai DeepSeek V4 Pro di Codex”, saya penasaran apakah Anda bisa membagikan bridge itu
      DeepSeek v4 sangat bagus bila dipakai dengan claude-code atau opencode. Dalam kasus saya, claude code menghabiskan biaya lebih sedikit daripada opencode, mungkin karena lingkungan eksekusinya dirancang lebih baik
    • Ini terlihat seperti terpasang native ke terminal. Artinya, sepertinya tidak ada aplikasi terpisah yang menjalankan atau membungkus agen di dalam TUI
      Jadi pada akhirnya ini tampaknya memakai kalimat bahasa Inggris biasa alih-alih perintah
  • Situs web ini terlihat seperti dibuat oleh Codex. Saya pernah meminta Codex membuat HTML ikhtisar fitur untuk tim, lalu yang keluar adalah monster yang terlalu dihias, dengan kotak statistik besar yang hampir tidak berisi informasi bermakna, dan bahkan font, warna, layout, sampai hero section-nya sangat mirip
    Sama seperti situs ini, tampilannya juga mengerikan di mobile. Pada akhirnya saya meminta Claude membuat file HTML satu halaman, dan sekitar 95% hasilnya bisa langsung dipakai untuk menjelaskan maksud dengan jelas, hanya perlu sedikit penyesuaian

    • Banyak desain berbasis LLM belakangan memang terlihat seperti ini. Saya tidak tahu kenapa orang tidak merasa kombinasi font serif yang sangat miring itu jelek
      Di mobile, contoh kode terus mendorong konten lain keluar, sehingga sebagian besar halaman jadi sulit dibaca. Tentu ini mungkin penilaian yang terlalu keras dan niatnya bagus, tapi situs yang lebih sederhana seharusnya sudah cukup
    • Ucapan “Claude membuat file HTML satu halaman dan 95% hasilnya bisa langsung dipakai” sendiri tidak banyak mengatakan apa pun tentang model mana pun
      Seperti yang diketahui semua software engineer, menghapus fitur bisa membuat proyek apa pun jadi jauh lebih sederhana
  • Yang saya harap penulis pahami adalah, ada orang yang menginginkan binary tunggal yang self-contained yang tidak memakan setengah memori komputer, dan karena itu ingin menulisnya dalam Rust atau Go

    • Saya sangat senang makin banyak software baru ditulis dalam Rust, Go, dan Zig
      Nilai dan kenyamanan pengembangan yang dulu diberikan bahasa interpreter yang lambat makin memudar. Bahasa-bahasa baru sudah membawa hal-hal bagus sebagai default, atau lebih tepatnya mungkin alarm panggilan jam 1 pagi mulai membuat kita kesal
    • Terlepas dari penggunaan AI dan segala klaimnya, saya penasaran apakah ada yang bisa menjelaskan kenapa misalnya kita tidak bisa membuat agen coding dalam Go murni
      Go sudah punya banyak library terminal yang bagus
    • Kalau Anda ingin mencoba binary tunggal self-contained yang memakan lebih dari setengah memori komputer, ada juga ds4-agent
    • Khususnya di era agen coding, kalau memang menginginkan itu, bukankah tinggal membuatnya sendiri saja?
    • Membuat bot coding sambil justru menghindari coding sendiri rasanya mengatakan sesuatu
  • Saya tidak suka halaman itu. Karena animasi mengetik, ukuran area contoh terus berubah, dan konten di bawahnya terdorong naik turun
    Itu pengalaman pengguna yang sangat buruk

    • Mau ada agen atau tidak, orang tetap harus menguji situs web di berbagai resolusi atau setidaknya berbagai lebar jendela
      Tapi rasanya ini makin menjadi keterampilan yang hilang
    • Terlihat seperti sampah AI desain buatan Claude
  • Dari sudut pandang seseorang yang sudah setahun membangun lingkungan eksekusi, orang-orang opencode itu bukan bodoh sampai merusak cache awalan
    Biasanya mereka sengaja melakukannya karena setelah diuji hasil keseluruhannya memang lebih baik
    Jika Anda merasa dsv4 cukup berbeda dari perilaku rata-rata model lain, kirim saja PR ke lingkungan eksekusi yang Anda inginkan dengan penanganan pengecualian spesifik beserta alasannya. Mengasumsikan secara membabi buta bahwa “demi cache semuanya harus append-only” hanya membuang waktu semua orang

  • Ini bukan agen yang dibuat DeepSeek, jadi judulnya menyesatkan

  • Sekarang merek DeepSeek sudah cukup kuat, sampai orang-orang mulai ingin menumpang pada pengenalan merek itu

  • Cukup menarik. Saya berlangganan Claude seharga 200 dolar per bulan, dan sejauh ini hampir tidak pernah perlu memakai yang lain
    Tapi makin Claude membatasi alur kerja saya, terutama setelah perubahan terbaru pada penggunaan IDE/-p, makin saya ingin pindah ke tempat lain
    Saya memang sangat menginginkan kemampuan reasoning terdepan, jadi agak khawatir, tapi saya tetap tertarik pada DeepSeek

    • Kalau Anda ingin reasoning terdepan, sebaiknya coba juga model lain dan lihat sendiri seberapa besar bedanya dengan model papan atas
      Saya melakukannya dan sadar bahwa Qwen-2.5-Max saja sudah cukup untuk saya. Untuk pekerjaan main-main yang saya tangani, saya rasa Claude Sonnet 3.5 pun sudah cukup. Saya bukan sedang memburu Fields Medal matematika
    • Hari ini saya memberi tugas rekayasa balik yang cukup rumit ke DS-4 xhigh dan GPT-5.5 xhigh
      Sekitar 6 jam kemudian, keduanya gagal melakukan reverse engineering sepenuhnya, tetapi perbedaannya besar
      DS berhenti tiap 30 menit sambil berkata sudah menyelesaikan reverse engineering sepenuhnya dan sekarang semuanya akan berjalan, padahal nyatanya bahkan 1% pun belum selesai. Saya sudah memberi instruksi keras agar tidak memakai jalan pintas tertentu, tapi ia tetap terus mencarinya, dan hasilnya gagal total
      Sebaliknya, GPT-5.5 benar-benar mengesankan. Ia melakukan apa yang seharusnya dikerjakan, menyelesaikan lapisan awal, dan tidak lanjut ke tahap berikutnya sebelum yakin sudah sepenuhnya memahami apa yang diperlukan. Selama 6 jam itu saya hanya memberi prompt ketika saya melihat ia bergerak ke arah yang benar dan ingin mengarahkannya sedikit dengan cara yang lebih baik. Tidak terasa seperti sedang bertarung melawannya
      Memang setelah kompresi kadang ia tiba-tiba berkata semacam “saya tidak bisa membantu reverse engineering”, tetapi di sesi baru itu beres dengan rapi
      Saya sudah membatalkan langganan Claude sebulan lalu jadi tidak bisa membandingkan, tetapi DeepSeek sangat mengingatkan saya pada pengalaman bekerja dengan Opus 4.6/4.7. Mungkin bagi sebagian orang itu sinyal positif, tetapi setelah melihat GPT-5.5, cara kerja ala Claude/DS terasa terlalu menjengkelkan
    • Sebaiknya tetap pakai paket 200 dolar per bulan, dan jangan coba paket coding 10 dolar dengan model open-weight dan limit lebih tinggi
      Anthropic butuh uang Anda untuk bertahan hidup, dan Anda akan tidur lebih nyenyak karena merasa sedang memakai yang tercanggih
    • Daripada meninggalkan model Anthropic sepenuhnya, Anda juga bisa tetap memakainya untuk beberapa tugas seperti perencanaan, lalu menyerahkan implementasinya ke DeepSeek atau yang sejenis
      Bahkan dengan alat yang berbeda, dokumen rencana Markdown bekerja cukup baik. Kalau saya turun dari langganan 5x Max ke Pro, itulah yang akan saya lakukan
      Saya juga sedang membuat launcher yang memudahkan penggunaan provider pihak ketiga di Claude Code: https://ccode.kronis.dev
      Proxy lokalnya sudah berjalan, hanya pergantian model dinamis yang belum ada. Sepertinya tidak terlalu sulit untuk ditambahkan, dan tergantung jadwal, kemungkinan masuk dalam 1–2 minggu
      Saya rasa tidak bijak untuk sepenuhnya meninggalkan Anthropic. Modelnya sangat bagus, dan dengan berlangganan saya juga mendapat fitur seperti Remote Control yang saya sukai. Namun mengganti tier untuk sedikit menghemat uang tampaknya masuk akal. Di sisi lain, tetap perlu baseline kualitas. Dulu saat saya memakai GLM 4.6 di Cerebras, hasil yang sembrono cukup sering muncul
    • Kalau Anda ingin reasoning terdepan, Anda harus memakai GPT 5.5 Pro
  • Saya suka fokusnya pada efisiensi cache hit. Salut untuk tim DeepSeek karena telah membuat produk hebat yang memaksimalkan efisiensi biaya bagi pengguna

    • Saya sudah memakainya beberapa waktu dan sepenuhnya setuju. Menurut saya ini sebagus Codex atau Claude yang saya pakai berdampingan
      Di skenario yang sensitif biaya, ini pemenangnya, dan kalau ada startup yang bisa mengemasnya dengan baik sambil memperhatikan retensi data, ini bisa menjadi produk bagus untuk dijual ke perusahaan. Karena isu utama untuk asisten coding adalah retensi data dan privasi
    • Sekadar mengingatkan, proyek ini adalah side project seseorang
      “Proyek open source independen · tidak berafiliasi dengan DeepSeek”
    • Ditambah biaya API yang memang sudah murah, mungkin Anda bahkan bisa menjalankan pekerjaan yang sama selama berhari-hari
    • Saya tidak paham bagaimana efisiensi cache hit itu bisa dimungkinkan. Bukankah ini cuma soal tidak mengubah konteks sebelumnya?
      Saya tidak mengerti tuas apa yang sebenarnya bisa disetel di sini
  • Saya mencobanya dan area input teksnya berlatar hitam dengan font gelap
    Saya memeriksa dokumentasi dan meminta bantuan font/gaya ke DeepSeek v4, Claude, dan Gemini, tetapi tidak ada yang berhasil selain menjalankannya di terminal bertema gelap. Gila. Apa para pengembang proyek ini tidak ada yang memakai tema terang?

    • Saya setuju itu masalah, tapi mungkin memang benar-benar hampir tidak ada yang memakainya
      Tema terang memang sangat jarang digunakan