ColossalChat - Solusi open source pipeline RLHF untuk mereplikasi ChatGPT

xguru · 2023-03-31T11:32:02+09:00

Berbasis model LLaMA Pengumpulan data supervised Fine-tuning supervised Pelatihan model reward Fine-tuning Reinforcement Learning Konten yang disertakan Demo interaktif yang berjalan online Open source kode pelatihan RLHF lengkap yang mencakup model 7B/13B Dataset bilingual 104k dalam bahasa Mandarin/Inggris Kuantisasi 4-bit untuk model 7B. Hanya memerlukan memori GPU 4GB Termasuk bobot model. Dapat direproduksi dengan mudah di satu server Model/dataset/optimisasi berskala besar dan lainnya juga akan terus ditambahkan

(medium.com/@yangyou_berkeley)

10 poin oleh xguru 2023-03-31 | Belum ada komentar. | Bagikan ke WhatsApp

Berbasis model LLaMA
- Pengumpulan data supervised
- Fine-tuning supervised
- Pelatihan model reward
- Fine-tuning Reinforcement Learning
Konten yang disertakan
- Demo interaktif yang berjalan online
- Open source kode pelatihan RLHF lengkap yang mencakup model 7B/13B
- Dataset bilingual 104k dalam bahasa Mandarin/Inggris
- Kuantisasi 4-bit untuk model 7B. Hanya memerlukan memori GPU 4GB
- Termasuk bobot model. Dapat direproduksi dengan mudah di satu server
- Model/dataset/optimisasi berskala besar dan lainnya juga akan terus ditambahkan

ColossalChat - Solusi open source pipeline RLHF untuk mereplikasi ChatGPT

Bacaan terkait

Belum ada komentar.