Kondisi Terkini Model Bahasa Open Source

xguru · 2023-08-09T11:03:01+09:00

Semakin memanas setelah peluncuran LLaMA 2 Hampir semua grup model open source memperbarui model mereka dengan model dasar baru WizardLM, Airoboros, Hermes, dll. Model paling kuat saat ini adalah Stable Beluga 2 dari StabilityAI Menyempurnakan model Llama2 70B dengan fine-tuning pada dataset bergaya Orca Dapat dibandingkan dengan ChatGPT Model long-context LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K Model kecil tetapi kuat Model parameter 3B yang sekuat 7B Batasnya masih belum tercapai, dan masih banyak ruang untuk berkembang SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP) Model terbuka mengalahkan ChatGPT di MMLU: llama-2-70b-guanaco-qlora Chat multi-turn: llama2-13b-orca-8k-3319 Model-model Tiongkok sedang bersaing: CodeGeex2 Apakah model terbuka sudah mencapai level ChatGPT? Belum, tetapi mungkin akan segera mencapainya

(twitter.com/Yampeleg)

22 poin oleh xguru 2023-08-09 | 3 komentar | Bagikan ke WhatsApp

Semakin memanas setelah peluncuran LLaMA 2
- Hampir semua grup model open source memperbarui model mereka dengan model dasar baru
  - WizardLM, Airoboros, Hermes, dll.
- Model paling kuat saat ini adalah Stable Beluga 2 dari StabilityAI
  - Menyempurnakan model Llama2 70B dengan fine-tuning pada dataset bergaya Orca
  - Dapat dibandingkan dengan ChatGPT
Model long-context
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
Model kecil tetapi kuat
- Model parameter 3B yang sekuat 7B
- Batasnya masih belum tercapai, dan masih banyak ruang untuk berkembang
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
Model terbuka mengalahkan ChatGPT di MMLU: llama-2-70b-guanaco-qlora
Chat multi-turn: llama2-13b-orca-8k-3319
Model-model Tiongkok sedang bersaing: CodeGeex2
Apakah model terbuka sudah mencapai level ChatGPT?
- Belum, tetapi mungkin akan segera mencapainya

3 komentar

botplaysdice 2023-08-10

Sepertinya kekhawatiran tentang monetisasi—bagaimana menghasilkan uang dari peran masing-masing—akan makin besar.

geekbini 2023-08-09

Sekarang ada begitu banyak layanan AI sehingga jadi bingung memilih, mulai dari layanan AI serbaguna sampai layanan AI yang dikhususkan untuk developer juga~

kuroneko 2023-08-09

Semoga model bahasa Korea juga berkembang.

Kondisi Terkini Model Bahasa Open Source

Bacaan terkait

3 komentar