R2R V2 - mesin RAG open source yang siap untuk produksi
(github.com/SciPhi-AI)- Dirancang untuk menjembatani kesenjangan antara eksperimen LLM lokal dan sistem Retrieval-Augmented Generation (RAG) tingkat produksi
- Menyediakan sistem RAG yang komprehensif dan mutakhir, dibangun agar mudah digunakan oleh pengembang dengan RESTful API sebagai pusatnya
Fitur utama
- Dukungan multimodal: Mendukung berbagai format file seperti
.txt,.pdf,.json,.png,.mp3, dan lainnya. - Pencarian hibrida: Menggabungkan pencarian semantik dan kata kunci untuk meningkatkan relevansi.
- Graph RAG: Mengekstrak relasi secara otomatis dan membangun knowledge graph.
- Manajemen aplikasi: Mengelola dokumen dan pengguna secara efisien serta menyediakan observabilitas dan fitur analitik yang kaya.
- Client-server: Mendukung RESTful API.
- Dapat dikonfigurasi: Aplikasi dapat diprovisikan menggunakan berkas konfigurasi yang intuitif.
- Dapat diperluas: Aplikasi dapat diperluas dengan mudah melalui pola builder + factory.
- Dashboard: Menyediakan dashboard R2R, aplikasi React+Next.js open source untuk interaksi yang ramah pengguna.
Dashboard R2R
Bisa berinteraksi dengan R2R menggunakan dashboard React+Next.js open source. Anda dapat memulai dengan merujuk ke Cookbook dashboard.
1 komentar
Opini Hacker News
Akurasi dan efisiensi ekstraksi data: Proses ekstraksi data merupakan tantangan penting dalam sistem RAG. Karena pendekatan OCR tradisional kurang memadai, pendekatan multimodal LLM + OCR digunakan untuk meningkatkan akurasi dan konsistensi.
Pengalaman mengoperasikan stack serupa: Selama 2 tahun telah mengoperasikan stack yang serupa, menggunakan teknologi seperti Pgvector, HyDe, pencarian web + pencarian dokumen. Tersedia dashboard yang baik termasuk log dan analitik.
Sulitnya memulai dengan cepat: Quick start ternyata tidak benar-benar cepat. Perlu menyediakan konfigurasi yang mencakup Docker Compose dan image Postgres. Ada juga ketidaknyamanan karena harus meng-clone repo terpisah untuk menggunakan dashboard.
Kompleksitas proyek: Proyek ini mencakup banyak elemen, tetapi tidak membuat pengembangan menjadi lebih mudah. Membingungkan apakah ini SDK atau kumpulan aplikasi. Perlu menyediakan pengalaman instalasi "1 klik" agar semua fitur bisa dipratinjau.
Verifikasi akurasi: Pertanyaan tentang bagaimana memverifikasi akurasi jawaban. Ada rasa ingin tahu apakah ada cara untuk melacak proses terbentuknya jawaban.
Sulitnya pengumpulan data: Di banyak proyek RAG, pengumpulan data belum benar-benar terselesaikan. Ada pertanyaan tentang cara mengumpulkan dokumen HTML dalam jumlah besar ke dalam sistem secara batch.
Pengumpulan data multimodal: Meminta penjelasan lebih rinci tentang proses pengumpulan data multimodal. Ada pertanyaan tentang jenis data yang saat ini dapat diproses R2R dan bagaimana cara melakukan embedding untuk tipe data non-teks.
Optimasi untuk tim pengembang: Meminta penjelasan tentang bagaimana prosesnya menjadi lebih cepat dan optimal bagi tim pengembang. Ada potensi besar untuk mempercepat waktu pengembangan MVP (produk dengan fitur minimum).
Bekerja dengan kode sumber: Sedang mencari solusi RAG yang dapat memahami kode sumber. Misalnya, menginginkan kemampuan untuk memahami "event analitik yang dipanggil saat tombol submit diklik".
Menolak penggunaan Neo4j: Tidak ingin menggunakan Neo4j karena konsumsi sumber dayanya besar.
Integrasi dengan frontend chat populer: Pertanyaan tentang apakah ada integrasi dengan frontend chat populer seperti OpenWebUI.