- Meta AI merilis SeamlessM4T, model dasar multibahasa dan multitugas yang memungkinkan penerjemahan dan transkripsi secara mulus antara suara dan teks
- Mendukung pengenalan suara otomatis, terjemahan suara-ke-teks, terjemahan suara-ke-suara, terjemahan teks-ke-teks, dan terjemahan teks-ke-suara untuk berbagai bahasa
- Pengenalan suara otomatis untuk lebih dari 100 bahasa
- Terjemahan suara-ke-teks untuk lebih dari 100 bahasa input dan output
- Terjemahan suara-ke-suara yang mendukung lebih dari 100 bahasa input dan 35 bahasa output (+Inggris)
- Terjemahan teks-ke-teks untuk lebih dari 100 bahasa
- Sintesis suara dari teks, mendukung lebih dari 100 bahasa input dan 35 bahasa output (+Inggris)
- Model SeamlessM4T dirilis dengan lisensi CC BY-NC 4.0 untuk peneliti dan pengembang
- Dataset terjemahan multimodal SeamlessAlign berdurasi 27 jam juga dirilis bersama
1 komentar
Baca lebih lanjut