- Vicuna v0 13B dengan fine-tuning instruksi dan pelatihan RLHF
- SFT (Supervised Fine-Tuning) menggunakan 3 dataset
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
- Dapat diunduh di HuggingFace sebagai delta bobot untuk model LLaMA (memerlukan data LLaMA asli)
Belum ada komentar.