Yi - LLM dwibahasa open-source generasi berikutnya
(github.com/01-ai)- Model bahasa besar open-source generasi berikutnya yang dilatih dari nol oleh para pengembang
- Ditujukan sebagai model dwibahasa dan dilatih dengan korpus multibahasa 3T, menunjukkan performa kuat dalam pemahaman bahasa, penalaran berbasis pengetahuan umum, kemampuan membaca pemahaman, dan lainnya
- Berbasis model bahasa pra-pelatihan 6B dan 34B, lalu diperluas menjadi model chatbot, model konteks panjang 200K, model depth upscaling, dan model vision-language
- Model Yi-34B-Chat
- Meraih peringkat ke-2 di leaderboard AlpacaEval setelah GPT-4 Turbo, mengungguli LLM lain
- Mengungguli model open-source yang sudah ada baik dalam bahasa Inggris maupun Mandarin, serta menempati peringkat pertama di berbagai benchmark
- Mengadopsi arsitektur model yang sama dengan Llama, tetapi bukan model turunan Llama. Tidak menggunakan bobot Llama
- Tersedia dalam berbagai ukuran, dan model dapat di-fine-tune sesuai kebutuhan spesifik
- Model chat
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Model dasar
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Model chat
1 komentar
Opini Hacker News