FLAMEHAVEN FileSearch v1.3.1 – Menghapus ketergantungan ML dan merombak besar-besaran mesin pencarian semantik
(github.com/flamehaven01)FLAMEHAVEN FileSearch adalah proyek open source yang berawal dari pertanyaan:
👉 “Bisakah RAG untuk pencarian dokumen dibuat ringan, reproducible, dan sepenuhnya self-hosted?”
Saat ini proyek ini memiliki ⭐ 81 Star / 🍴 11 Fork. Meski masih berskala kecil, proyek ini terus menghadirkan peningkatan yang jelas di setiap rilis.
Rilis v1.3.1 kali ini bukan sekadar penambahan fitur, melainkan pembaruan yang mematahkan asumsi bahwa
👉 “pencarian semantik = stack ML yang berat”.
🔍 Ringkasan proyek dalam satu kalimat
-
Mesin pencarian RAG self-hosted
-
Unggah dokumen (PDF/DOCX/MD/TXT), lalu lakukan pencarian keyword + semantik + hybrid
-
Berjalan secara lokal tanpa vector DB eksternal
-
Bisa dijalankan dalam kurang dari 3 menit dengan satu baris Docker
✨ Pembaruan inti v1.3.1 (poin yang disukai developer)
1️⃣ Penghapusan total ketergantungan ML (perubahan terbesar)
-
sentence-transformers/torchdihapus sepenuhnya -
Mengadopsi DSP v2.0 (Deterministic Semantic Projection) yang diimplementasikan sendiri
-
✔️ pembuatan vektor < 1ms
-
✔️ tidak ada latensi inisialisasi (sebelumnya 2 menit → langsung)
-
Tetap merupakan pencarian semantik, tetapi berjalan secara deterministik tanpa framework ML
2️⃣ Optimasi memori & performa
-
Kuantisasi vektor int8
→ penggunaan memori berkurang 75% -
Perhitungan cosine similarity lebih cepat lebih dari 30%
-
Metadata dikompresi lebih dari 90% (Gravitas-Pack)
-
Dapat dioperasikan tanpa beban besar bahkan di server pribadi / VM internal perusahaan
3️⃣ Perluasan mode pencarian
-
Mendukung mode pencarian keyword / semantic / hybrid
-
Termasuk typo correction + query refinement
-
Sepenuhnya backward-compatible dengan API yang ada
4️⃣ Stabilitas & reliabilitas
-
Framework pengujian diubah dari
pytest→unittest -
19/19 tes lulus (0.33s)
-
Menghilangkan timeout dan ketidakstabilan CI
🔐 Fitur produksi yang tetap dipertahankan
-
Autentikasi dan manajemen izin berbasis API Key
-
Rate limiting / Audit log
-
Batch search (1~100 queries)
-
Cache Redis opsional
-
Metrik Prometheus
👀 Sangat cocok khususnya untuk
-
Tim yang membutuhkan RAG lokal untuk pencarian dokumen internal
-
Lingkungan yang sulit mengunggah data ke SaaS eksternal (seperti Pinecone)
-
Developer yang berada pada tahap “PoC sudah berhasil, tetapi bagaimana cara mengoperasikannya?”
-
Engineer yang memprioritaskan reproducibility / biaya / kontrol
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---Jika Anda mencobanya dan merasa terbantu, menekan ⭐ sekali saja akan sangat berarti.
Masukan, feedback, dan PR semuanya sangat disambut.
Belum ada komentar.