LIMA - Mencapai performa mendekati GPT-4 hanya dengan model LLaMA 65B dan 1000 prompt

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" Model LLaMA yang di-fine-tune hanya dengan 1000 prompt yang dikurasi dengan baik, tanpa reinforcement learning maupun pemodelan preferensi Pada 43% kasus, setara dengan atau lebih disukai daripada GPT-4; 58% saat dibandingkan dengan Bard, dan 65% lebih tinggi dibanding DaVinci003 yang dilatih dengan umpan balik manusia Hipotesis makalah ini adalah bahwa hampir seluruh pengetahuan LLM dipelajari selama pretraining, dan alignment adalah proses sederhana untuk mempelajari format/gaya dalam berinteraksi dengan pengguna Makalah baru dari Meta AI

(arxiv.org)

24 poin oleh xguru 2023-05-23 | 4 komentar | Bagikan ke WhatsApp

"Less Is More for Alignment"
Model LLaMA yang di-fine-tune hanya dengan 1000 prompt yang dikurasi dengan baik, tanpa reinforcement learning maupun pemodelan preferensi
Pada 43% kasus, setara dengan atau lebih disukai daripada GPT-4; 58% saat dibandingkan dengan Bard, dan 65% lebih tinggi dibanding DaVinci003 yang dilatih dengan umpan balik manusia
Hipotesis makalah ini adalah bahwa hampir seluruh pengetahuan LLM dipelajari selama pretraining, dan alignment adalah proses sederhana untuk mempelajari format/gaya dalam berinteraksi dengan pengguna
Makalah baru dari Meta AI

4 komentar

merong 2023-05-23

Proyek Sejong seharusnya terus dilanjutkan sehingga data model bahasa Korea bisa diakumulasikan sebagai open source. Benar-benar proyek yang sangat disayangkan...

kuroneko 2023-05-23

Performa bahasa Inggris berkembang secepat ini, tapi sayangnya sebagian besar model selain GPT masih belum bagus dalam bahasa Korea...

dulco 2023-05-23

Pembelajaran bahasa Korea Claude dari Anthropic sudah berada di tingkat yang cukup tinggi, tetapi kemampuan ekspresinya masih agak berbeda dibandingkan ChatGPT.

test4458 2023-05-23

huhu benar. Untuk bahasa Korea, selain GPT API semuanya memang berada di level sampah...

LIMA - Mencapai performa mendekati GPT-4 hanya dengan model LLaMA 65B dan 1000 prompt

Bacaan terkait

4 komentar