Mencapai Platform Skeleton (Mini Palantir): Graph-RAG lokal + middleware kognitif + awal kolaborasi eksternal JAMES v0.3.0 (open source, alpha)
(github.com/Hashevolution)Ringkasan satu baris
Mesin pengetahuan Graph-RAG 100% lokal yang menjadikan keamanan sebagai prinsip desain.
Dengan mencapai v0.3.0 Platform Skeleton (2026-05-17), lapisan middleware kognitif kini
bukan lagi sekadar desain, melainkan sudah naik ke main dalam bentuk kode.
- GitHub: https://github.com/Hashevolution/James-RAG-Evol
- Versi saat ini: v0.3.0 (lulus Foundation Hardening 6/6 axes, gate dibersihkan pada 2026-05-13)
- Lisensi: MIT
- Validasi eksternal: badge OpenSSF Best Practices passing (Tiered 111%, project #12806)
- Alias: "Mini Palantir" (Palantir adalah merek dagang Palantir Technologies, tidak terkait langsung dengan JAMES — hanya analogi karena pola typed-graph + preservasi jejak audit yang mirip)
[IMG] Visualisasi ontologi 3D JAMES
v0.2 → v0.3, apa yang berubah dalam 9 hari
- Lapisan middleware kognitif Phase 2 sudah mendarat di main
- verification engine (PR #290) / planner·task decomposition (PR #297) / tool router (PR #295)
- Verifikasi, perencanaan, dan perutean tool kini bukan lagi design doc, melainkan modul yang bisa di-import
- Knowledge Cascade Phase A → E: migrasi produksi 213 entities / 656 relations selesai
- Pipeline keamanan 3-tahap dipertahankan: input
pre_check→ retrieval ABAC → outputpost_filter+ PII mask - Log audit self-evolving: semua patch memiliki
approver_username, tidak bisa dilewati - Password bcrypt + migrasi transparan SHA-256 (PR #173), baseline ruff F-class + workflow lint GitHub Actions (PR #205)
Hal-hal yang terjadi di luar proyek (bukti bahwa ini bukan dibuat sendirian)
- Kolaborasi eksternal pertama sedang berjalan dengan Ali Afana (pendiri Provia, dev.to Featured) — 6 putaran LinkedIn DM + thread komentar dev.to
- Pekerjaan bersama: pemisahan suite regresi injection 83 item, benchmark varian v0.3 Gemma 4 (E4B / 26B MoE / 31B Dense)
- Hasil bersama: injection-fixtures schema v1.1 (PR #311 → #317 → #322, semua usulan Ali seperti invariant normalization,
expected_block_stage, dancatalog_contextsudah diterapkan, sumber dicantumkan di diff-log) - Praregistrasi: rencana evaluasi 3×3 (3 varian × 3 suhu × 1 struktur prompt, 4 hipotesis + decision matrix, dikunci lewat PR #315 sebelum satu sel pun dijalankan)
- Titik kontak untuk implementer eksternal: kontrak LLM Provider (PR #316, 6 perilaku wajib + reserved kwargs/env vars, termasuk sketsa backend Gemini API ~30 baris)
- Kandidat kolaborasi kedua — Matija Fućek(@mfucek_, naumu.ai) membalas tweet visualisasi 3D dengan membagikan demo proyeknya sendiri (aplikasi otak perusahaan plug-and-play), membuka jalur kolaborasi
- Pengajuan 2 track Gemma 4 Challenge selesai:
- Build with Gemma 4: Building a Mini Palantir on gemma4:e4b
- Write with Gemma 4: 5 empty responses from gemma4:e4b. 4 hypotheses. 0 root cause. — format fair-witness, melaporkan kegagalan tanpa dipoles
Keterbatasan yang jujur (tahap alpha, tidak ada yang disembunyikan)
- Middleware kognitif Phase 2 sudah naik ke main, tetapi validasi multi-pengguna dan beban besar adalah gate v0.4
- Multimodal sudah terhubung hingga LLaVA, Whisper, dan ffmpeg (working prototype). Integrasi retrieval ditargetkan untuk v0.3.x ~ v0.4
- Scaffold self-evolving tervalidasi di lingkungan single-user, workflow multi-approver belum tervalidasi
- Gemma 4 E4B menghasilkan 5 respons kosong pada tahap kognitif, dan keempat hipotesis belum dapat memastikan root cause (dipublikasikan apa adanya di tulisan track Write)
Bisa dipakai untuk apa
- Saat ingin menangani wiki/catatan internal hanya secara lokal tanpa mengirimnya ke API eksternal
- Demo/riset RAG yang mengharuskan jalur inferensi (typed
graph_pathberbentukA --[CAUSES]--> X --[REQUIRES]--> Y) ditampilkan sebagai graf bersama respons - Referensi pola security RAG (pipeline 3-tahap, instruction isolation, migrasi bcrypt, baseline ruff semuanya dipublikasikan per-PR)
- Untuk yang membutuhkan titik masuk plugin — loader
JAMES_PLUGINSdan Backend Protocol sedang distabilkan di v0.3.x
Memulai
git clone https://github.com/Hashevolution/James-RAG-Evol
cp .env.example .env
pip install -r requirements.txt
ollama pull gemma2:2b # jika tidak punya GPU, mulai dengan ini
python server_llmwiki.py # http://localhost:8000
1 komentar
Halo. Pertanyaan selalu kami sambut kapan saja —
Di bawah ini adalah perbandingan pada tingkat desain sistem.
Arsitektur JAMES (v0.3.0) saat ini adalah sebagai berikut.
Tidak ada lapisan formal query language — pencarian hibrida di
core/retrieval_engine.pymenggunakan fusi skor 4 arah berupa dense embedding + BM25 + keyword + name, dan tidak mengubah kueri NL menjadi bahasa formal seperti SPARQL/RDF/SQL. Skor embedding dan BM25 digunakan apa adanya untuk pemilihan node kandidat.Respons LLM berupa NL — di
core/reasoning/modes/chat.py, LLM menerima prompt NL dan menghasilkan jawaban dalam teks NL, tanpa tahap perantara formal-language.Pembaruan KG dipisahkan dengan gerbang persetujuan manusia — dinyatakan pada kalimat pertama docstring modul
core/change_request.py: "Every write inside JAMES becomes a proposal in this module first; only a separate reviewer's approval turns the proposal into a real write." Artinya, tidak ada jalur di dalam sistem yang secara otomatis berdasarkan respons LLM melakukan add/modify/remove ke KG.wiki_editjuga memiliki gerbang hak admin, dan memaksa alur propose → review → apply padachange_request(lihat CLAUDE.md §3, ARCHITECTURE.md §5.6 yang terkait).Mohon pertimbangkan bahwa JAMES masih berada pada tahap alpha nonkomersial,
Selain itu, jika Anda menginginkan analisis yang lebih mendalam, kami akan senang jika bisa meninjaunya bersama di GitHub Issue.
Saya rasa beragam umpan balik adalah hal yang paling berharga karena memungkinkan pilihan desain proyek ini diperiksa secara jujur. Terima kasih.