Stability AI merilis StableVicuna, chatbot LLM RLHF open-source pertama di dunia

xguru · 2023-05-01T10:32:02+09:00

Vicuna v0 13B dengan fine-tuning instruksi dan pelatihan RLHF SFT (Supervised Fine-Tuning) menggunakan 3 dataset OpenAssistant Conversations Dataset (OASST1) GPT4All Prompt Generations Alpaca Dapat diunduh di HuggingFace sebagai delta bobot untuk model LLaMA (memerlukan data LLaMA asli)

(stability.ai)

16 poin oleh xguru 2023-05-01 | Belum ada komentar. | Bagikan ke WhatsApp

Vicuna v0 13B dengan fine-tuning instruksi dan pelatihan RLHF
SFT (Supervised Fine-Tuning) menggunakan 3 dataset
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
Dapat diunduh di HuggingFace sebagai delta bobot untuk model LLaMA (memerlukan data LLaMA asli)

Stability AI merilis StableVicuna, chatbot LLM RLHF open-source pertama di dunia

Bacaan terkait

Belum ada komentar.