Cara menyediakan kumpulan dokumen khusus ke LLM
- Diskusi tentang cara terbaik memberikan kumpulan dokumen milik pengguna ke LLM (Large Language Models) agar memperoleh jawaban yang relevan tanpa hasil yang tidak realistis.
- Berfokus pada cara "mengajarkan" kumpulan dokumen tertentu kepada LLM. Ini tidak harus berarti melatih model sendiri, dan juga mencakup pendekatan seperti RAG (Retrieval-Augmented Generation).
- Ada thread dari 5 bulan lalu, tetapi dibutuhkan informasi yang sesuai dengan kondisi per Desember 2023.
Opini GN⁺
- Menggunakan LLM untuk mengekstrak informasi yang akurat dari kumpulan dokumen tertentu menjadi semakin penting seiring perkembangan teknologi.
- Teknologi semacam ini membantu pengguna mendapatkan hasil khusus yang mereka inginkan, dan dapat diterapkan di berbagai bidang seperti business intelligence, riset, dan pendidikan.
- Penting untuk memanfaatkan pendekatan yang sudah ada seperti RAG atau mencari metode baru, karena hal ini akan meningkatkan kegunaan LLM dan membantu memperoleh hasil yang lebih akurat dan dapat diandalkan.
1 komentar
Opini Hacker News
Pelatihan pada dokumen sebenarnya tidak benar-benar terjadi; banyak startup memakai istilah ini, tetapi pada praktiknya mereka menggunakan RAG (Retrieval-Augmented Generation).
Pendekatan yang berbeda perlu dipertimbangkan tergantung pada jumlah dokumen.
AWS Bedrock mudah digunakan; dokumen dapat diunggah ke S3 dan disinkronkan ke database vektor untuk dipakai melalui API.
h2ogpt adalah implementasi RAG yang lengkap fiturnya, mampu menangani dokumen dalam berbagai format dan mendukung beragam implementasi hosting model.
Anda dapat membeli akun ChatGPT dan mengunggah dokumen sendiri, lalu membuat AI percakapan yang disesuaikan.
GPT-4 Assistants saat ini dapat menangani RAG secara bawaan, dan PrivateGPT adalah salah satu opsi yang cukup dikenal untuk ini.
Copilot Builder dari Microsoft Office memungkinkan pengguna membuat AI Copilot dalam hitungan detik dengan menentukan URL dasar, file yang diunggah, dan sebagainya.
Cheshire Cat adalah framework asisten AI yang menyimpan dokumen sebagai "memori" untuk diambil kembali nanti.
Ada panduan video tentang cara melakukan fine-tuning Mistral 7B dengan QLoRA, dengan catatan bahwa teknik RAG mungkin lebih diinginkan.