Mencapai Platform Skeleton (Mini Palantir): Graph-RAG lokal + middleware kognitif + awal kolaborasi eksternal JAMES v0.3.0 (open source, alpha)

(github.com/Hashevolution)

7 poin oleh skanxhakr12 2026-05-19 | 1 komentar | Bagikan ke WhatsApp

Ringkasan satu baris

Mesin pengetahuan Graph-RAG 100% lokal yang menjadikan keamanan sebagai prinsip desain.
Dengan mencapai v0.3.0 Platform Skeleton (2026-05-17), lapisan middleware kognitif kini
bukan lagi sekadar desain, melainkan sudah naik ke main dalam bentuk kode.

GitHub: https://github.com/Hashevolution/James-RAG-Evol
Versi saat ini: v0.3.0 (lulus Foundation Hardening 6/6 axes, gate dibersihkan pada 2026-05-13)
Lisensi: MIT
Validasi eksternal: badge OpenSSF Best Practices passing (Tiered 111%, project #12806)
Alias: "Mini Palantir" (Palantir adalah merek dagang Palantir Technologies, tidak terkait langsung dengan JAMES — hanya analogi karena pola typed-graph + preservasi jejak audit yang mirip)

[IMG] Visualisasi ontologi 3D JAMES

v0.2 → v0.3, apa yang berubah dalam 9 hari

Lapisan middleware kognitif Phase 2 sudah mendarat di main
- verification engine (PR #290) / planner·task decomposition (PR #297) / tool router (PR #295)
- Verifikasi, perencanaan, dan perutean tool kini bukan lagi design doc, melainkan modul yang bisa di-import
Knowledge Cascade Phase A → E: migrasi produksi 213 entities / 656 relations selesai
Pipeline keamanan 3-tahap dipertahankan: input pre_check → retrieval ABAC → output post_filter + PII mask
Log audit self-evolving: semua patch memiliki approver_username, tidak bisa dilewati
Password bcrypt + migrasi transparan SHA-256 (PR #173), baseline ruff F-class + workflow lint GitHub Actions (PR #205)

Hal-hal yang terjadi di luar proyek (bukti bahwa ini bukan dibuat sendirian)

Kolaborasi eksternal pertama sedang berjalan dengan Ali Afana (pendiri Provia, dev.to Featured) — 6 putaran LinkedIn DM + thread komentar dev.to
- Pekerjaan bersama: pemisahan suite regresi injection 83 item, benchmark varian v0.3 Gemma 4 (E4B / 26B MoE / 31B Dense)
- Hasil bersama: injection-fixtures schema v1.1 (PR #311 → #317 → #322, semua usulan Ali seperti invariant normalization, expected_block_stage, dan catalog_context sudah diterapkan, sumber dicantumkan di diff-log)
- Praregistrasi: rencana evaluasi 3×3 (3 varian × 3 suhu × 1 struktur prompt, 4 hipotesis + decision matrix, dikunci lewat PR #315 sebelum satu sel pun dijalankan)
- Titik kontak untuk implementer eksternal: kontrak LLM Provider (PR #316, 6 perilaku wajib + reserved kwargs/env vars, termasuk sketsa backend Gemini API ~30 baris)
Kandidat kolaborasi kedua — Matija Fućek(@mfucek_, naumu.ai) membalas tweet visualisasi 3D dengan membagikan demo proyeknya sendiri (aplikasi otak perusahaan plug-and-play), membuka jalur kolaborasi
Pengajuan 2 track Gemma 4 Challenge selesai:
- Build with Gemma 4: Building a Mini Palantir on gemma4:e4b
- Write with Gemma 4: 5 empty responses from gemma4:e4b. 4 hypotheses. 0 root cause. — format fair-witness, melaporkan kegagalan tanpa dipoles

Keterbatasan yang jujur (tahap alpha, tidak ada yang disembunyikan)

Middleware kognitif Phase 2 sudah naik ke main, tetapi validasi multi-pengguna dan beban besar adalah gate v0.4
Multimodal sudah terhubung hingga LLaVA, Whisper, dan ffmpeg (working prototype). Integrasi retrieval ditargetkan untuk v0.3.x ~ v0.4
Scaffold self-evolving tervalidasi di lingkungan single-user, workflow multi-approver belum tervalidasi
Gemma 4 E4B menghasilkan 5 respons kosong pada tahap kognitif, dan keempat hipotesis belum dapat memastikan root cause (dipublikasikan apa adanya di tulisan track Write)

Bisa dipakai untuk apa

Saat ingin menangani wiki/catatan internal hanya secara lokal tanpa mengirimnya ke API eksternal
Demo/riset RAG yang mengharuskan jalur inferensi (typed graph_path berbentuk A --[CAUSES]--> X --[REQUIRES]--> Y) ditampilkan sebagai graf bersama respons
Referensi pola security RAG (pipeline 3-tahap, instruction isolation, migrasi bcrypt, baseline ruff semuanya dipublikasikan per-PR)
Untuk yang membutuhkan titik masuk plugin — loader JAMES_PLUGINS dan Backend Protocol sedang distabilkan di v0.3.x

Memulai

git clone https://github.com/Hashevolution/James-RAG-Evol  
cp .env.example .env  
pip install -r requirements.txt  
ollama pull gemma2:2b      # jika tidak punya GPU, mulai dengan ini  
python server_llmwiki.py   # http://localhost:8000

1 komentar

skanxhakr12 2026-05-19

Halo. Pertanyaan selalu kami sambut kapan saja —

Di bawah ini adalah perbandingan pada tingkat desain sistem.

Arsitektur JAMES (v0.3.0) saat ini adalah sebagai berikut.

Tidak ada lapisan formal query language — pencarian hibrida di core/retrieval_engine.py menggunakan fusi skor 4 arah berupa dense embedding + BM25 + keyword + name, dan tidak mengubah kueri NL menjadi bahasa formal seperti SPARQL/RDF/SQL. Skor embedding dan BM25 digunakan apa adanya untuk pemilihan node kandidat.
Respons LLM berupa NL — di core/reasoning/modes/chat.py, LLM menerima prompt NL dan menghasilkan jawaban dalam teks NL, tanpa tahap perantara formal-language.
Pembaruan KG dipisahkan dengan gerbang persetujuan manusia — dinyatakan pada kalimat pertama docstring modul core/change_request.py: "Every write inside JAMES becomes a proposal in this module first; only a separate reviewer's approval turns the proposal into a real write." Artinya, tidak ada jalur di dalam sistem yang secara otomatis berdasarkan respons LLM melakukan add/modify/remove ke KG. wiki_edit juga memiliki gerbang hak admin, dan memaksa alur propose → review → apply pada change_request (lihat CLAUDE.md §3, ARCHITECTURE.md §5.6 yang terkait).

Mohon pertimbangkan bahwa JAMES masih berada pada tahap alpha nonkomersial,

Selain itu, jika Anda menginginkan analisis yang lebih mendalam, kami akan senang jika bisa meninjaunya bersama di GitHub Issue.

Saya rasa beragam umpan balik adalah hal yang paling berharga karena memungkinkan pilihan desain proyek ini diperiksa secara jujur. Terima kasih.