1 poin oleh mansuiki 4 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp

Halo. Saya membuat turbo-graph, yang menambahkan graph memory layer untuk constrained RAG berbasis turbovec/TurboQuant.

turbovec sudah bagus untuk flat top-k atau saat ada allowlist yang murah. Namun dalam RAG nyata, kueri sering berbentuk seperti ini.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

Kombinasi ini setiap kali harus dirakit di Python/SQL/app layer, lalu dikirim lagi ke vector search, hasilnya di-rerank dengan graph/BM25, dan kode untuk menjelaskan mengapa hasil seperti itu pun terus berulang.

turbo-graph mempertahankan core yang kompatibel dengan turbovec, dan merupakan eksperimen untuk memindahkan graph/metadata view compilation, cache reuse, graph rerank, dan explain telemetry di sekitarnya ke lapisan indeks.

Karena masih Alpha, tujuannya bukan agar langsung dipakai di production, melainkan untuk mendapatkan masukan tentang API seperti apa yang dibutuhkan di route RAG nyata.

GitHub:
https://github.com/bigmacfive/turbo-graph

Belum ada komentar.

Belum ada komentar.