2 poin oleh flamehaven01 2025-12-19 | Belum ada komentar. | Bagikan ke WhatsApp

FLAMEHAVEN FileSearch adalah proyek open source yang berawal dari pertanyaan:
👉 “Bisakah RAG untuk pencarian dokumen dibuat ringan, reproducible, dan sepenuhnya self-hosted?”

Saat ini proyek ini memiliki ⭐ 81 Star / 🍴 11 Fork. Meski masih berskala kecil, proyek ini terus menghadirkan peningkatan yang jelas di setiap rilis.

Rilis v1.3.1 kali ini bukan sekadar penambahan fitur, melainkan pembaruan yang mematahkan asumsi bahwa
👉 “pencarian semantik = stack ML yang berat”.


🔍 Ringkasan proyek dalam satu kalimat

  • Mesin pencarian RAG self-hosted

  • Unggah dokumen (PDF/DOCX/MD/TXT), lalu lakukan pencarian keyword + semantik + hybrid

  • Berjalan secara lokal tanpa vector DB eksternal

  • Bisa dijalankan dalam kurang dari 3 menit dengan satu baris Docker


✨ Pembaruan inti v1.3.1 (poin yang disukai developer)
1️⃣ Penghapusan total ketergantungan ML (perubahan terbesar)

  • sentence-transformers / torch dihapus sepenuhnya

  • Mengadopsi DSP v2.0 (Deterministic Semantic Projection) yang diimplementasikan sendiri

  • ✔️ pembuatan vektor < 1ms

  • ✔️ tidak ada latensi inisialisasi (sebelumnya 2 menit → langsung)

  • Tetap merupakan pencarian semantik, tetapi berjalan secara deterministik tanpa framework ML


2️⃣ Optimasi memori & performa

  • Kuantisasi vektor int8
    → penggunaan memori berkurang 75%

  • Perhitungan cosine similarity lebih cepat lebih dari 30%

  • Metadata dikompresi lebih dari 90% (Gravitas-Pack)

  • Dapat dioperasikan tanpa beban besar bahkan di server pribadi / VM internal perusahaan


3️⃣ Perluasan mode pencarian

  • Mendukung mode pencarian keyword / semantic / hybrid

  • Termasuk typo correction + query refinement

  • Sepenuhnya backward-compatible dengan API yang ada


4️⃣ Stabilitas & reliabilitas

  • Framework pengujian diubah dari pytestunittest

  • 19/19 tes lulus (0.33s)

  • Menghilangkan timeout dan ketidakstabilan CI


🔐 Fitur produksi yang tetap dipertahankan

  • Autentikasi dan manajemen izin berbasis API Key

  • Rate limiting / Audit log

  • Batch search (1~100 queries)

  • Cache Redis opsional

  • Metrik Prometheus


👀 Sangat cocok khususnya untuk

  • Tim yang membutuhkan RAG lokal untuk pencarian dokumen internal

  • Lingkungan yang sulit mengunggah data ke SaaS eksternal (seperti Pinecone)

  • Developer yang berada pada tahap “PoC sudah berhasil, tetapi bagaimana cara mengoperasikannya?”

  • Engineer yang memprioritaskan reproducibility / biaya / kontrol


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---Jika Anda mencobanya dan merasa terbantu, menekan ⭐ sekali saja akan sangat berarti.
Masukan, feedback, dan PR semuanya sangat disambut.

Belum ada komentar.

Belum ada komentar.