5 poin oleh GN⁺ 2024-06-28 | 1 komentar | Bagikan ke WhatsApp
  • Dirancang untuk menjembatani kesenjangan antara eksperimen LLM lokal dan sistem Retrieval-Augmented Generation (RAG) tingkat produksi
  • Menyediakan sistem RAG yang komprehensif dan mutakhir, dibangun agar mudah digunakan oleh pengembang dengan RESTful API sebagai pusatnya

Fitur utama

  • Dukungan multimodal: Mendukung berbagai format file seperti .txt, .pdf, .json, .png, .mp3, dan lainnya.
  • Pencarian hibrida: Menggabungkan pencarian semantik dan kata kunci untuk meningkatkan relevansi.
  • Graph RAG: Mengekstrak relasi secara otomatis dan membangun knowledge graph.
  • Manajemen aplikasi: Mengelola dokumen dan pengguna secara efisien serta menyediakan observabilitas dan fitur analitik yang kaya.
  • Client-server: Mendukung RESTful API.
  • Dapat dikonfigurasi: Aplikasi dapat diprovisikan menggunakan berkas konfigurasi yang intuitif.
  • Dapat diperluas: Aplikasi dapat diperluas dengan mudah melalui pola builder + factory.
  • Dashboard: Menyediakan dashboard R2R, aplikasi React+Next.js open source untuk interaksi yang ramah pengguna.

Dashboard R2R

Bisa berinteraksi dengan R2R menggunakan dashboard React+Next.js open source. Anda dapat memulai dengan merujuk ke Cookbook dashboard.

1 komentar

 
GN⁺ 2024-06-28
Opini Hacker News
  • Akurasi dan efisiensi ekstraksi data: Proses ekstraksi data merupakan tantangan penting dalam sistem RAG. Karena pendekatan OCR tradisional kurang memadai, pendekatan multimodal LLM + OCR digunakan untuk meningkatkan akurasi dan konsistensi.

  • Pengalaman mengoperasikan stack serupa: Selama 2 tahun telah mengoperasikan stack yang serupa, menggunakan teknologi seperti Pgvector, HyDe, pencarian web + pencarian dokumen. Tersedia dashboard yang baik termasuk log dan analitik.

  • Sulitnya memulai dengan cepat: Quick start ternyata tidak benar-benar cepat. Perlu menyediakan konfigurasi yang mencakup Docker Compose dan image Postgres. Ada juga ketidaknyamanan karena harus meng-clone repo terpisah untuk menggunakan dashboard.

  • Kompleksitas proyek: Proyek ini mencakup banyak elemen, tetapi tidak membuat pengembangan menjadi lebih mudah. Membingungkan apakah ini SDK atau kumpulan aplikasi. Perlu menyediakan pengalaman instalasi "1 klik" agar semua fitur bisa dipratinjau.

  • Verifikasi akurasi: Pertanyaan tentang bagaimana memverifikasi akurasi jawaban. Ada rasa ingin tahu apakah ada cara untuk melacak proses terbentuknya jawaban.

  • Sulitnya pengumpulan data: Di banyak proyek RAG, pengumpulan data belum benar-benar terselesaikan. Ada pertanyaan tentang cara mengumpulkan dokumen HTML dalam jumlah besar ke dalam sistem secara batch.

  • Pengumpulan data multimodal: Meminta penjelasan lebih rinci tentang proses pengumpulan data multimodal. Ada pertanyaan tentang jenis data yang saat ini dapat diproses R2R dan bagaimana cara melakukan embedding untuk tipe data non-teks.

  • Optimasi untuk tim pengembang: Meminta penjelasan tentang bagaimana prosesnya menjadi lebih cepat dan optimal bagi tim pengembang. Ada potensi besar untuk mempercepat waktu pengembangan MVP (produk dengan fitur minimum).

  • Bekerja dengan kode sumber: Sedang mencari solusi RAG yang dapat memahami kode sumber. Misalnya, menginginkan kemampuan untuk memahami "event analitik yang dipanggil saat tombol submit diklik".

  • Menolak penggunaan Neo4j: Tidak ingin menggunakan Neo4j karena konsumsi sumber dayanya besar.

  • Integrasi dengan frontend chat populer: Pertanyaan tentang apakah ada integrasi dengan frontend chat populer seperti OpenWebUI.