MMS - Proyek teknologi suara 1000+ bahasa yang dirilis Meta

xguru · 2023-05-24T09:45:01+09:00

Massively Multilingual Speech Proyek untuk membuat satu model suara yang mendukung ribuan bahasa, melampaui model pengenalan suara yang sebelumnya hanya mendukung sekitar 100 bahasa, menuju lebih dari 7000 bahasa yang digunakan di bumi Menyediakan 1100+ model pengenalan suara multibahasa (ASR) dan model sintesis suara (TTS), 4000+ model identifikasi bahasa (LID), serta 1400+ model pra-pelatihan bahasa Bertujuan agar orang dapat mengakses dan menggunakan informasi dalam bahasa yang mereka inginkan langsung di perangkat Sebagai bagian dari proyek, dibangun dataset pembacaan Perjanjian Baru untuk 1100 bahasa dengan rata-rata 32 jam per bahasa, lalu memperluas bahasa yang dapat digunakan menjadi 4000 dengan memanfaatkan berbagai rekaman dokumen Kristen yang tidak berlabel File model yang dapat diunduh Model pre-trained: MMS-300M (3.5GB) dan MMS-1B (10GB) Model pengenalan suara ASR dan kamus tersedia: MMS-1B:FL102 (102 bahasa, 4.5GB), MMS-1B:L1107 (1107 bahasa, 13GB), MMS-1B-all (1162 bahasa, 13.7GB) Model sintesis suara TTS: file generator dan vocabulary untuk masing-masing dari 1107 bahasa Model identifikasi bahasa LID: 126, 256, 512, 1024, 2048, 4017 model dan kamus

(github.com/facebookresearch)

16 poin oleh xguru 2023-05-24 | 3 komentar | Bagikan ke WhatsApp

Massively Multilingual Speech
Proyek untuk membuat satu model suara yang mendukung ribuan bahasa, melampaui model pengenalan suara yang sebelumnya hanya mendukung sekitar 100 bahasa, menuju lebih dari 7000 bahasa yang digunakan di bumi
Menyediakan 1100+ model pengenalan suara multibahasa (ASR) dan model sintesis suara (TTS), 4000+ model identifikasi bahasa (LID), serta 1400+ model pra-pelatihan bahasa
Bertujuan agar orang dapat mengakses dan menggunakan informasi dalam bahasa yang mereka inginkan langsung di perangkat
Sebagai bagian dari proyek, dibangun dataset pembacaan Perjanjian Baru untuk 1100 bahasa dengan rata-rata 32 jam per bahasa, lalu memperluas bahasa yang dapat digunakan menjadi 4000 dengan memanfaatkan berbagai rekaman dokumen Kristen yang tidak berlabel

File model yang dapat diunduh

Model pre-trained: MMS-300M (3.5GB) dan MMS-1B (10GB)
Model pengenalan suara ASR dan kamus tersedia: MMS-1B:FL102 (102 bahasa, 4.5GB), MMS-1B:L1107 (1107 bahasa, 13GB), MMS-1B-all (1162 bahasa, 13.7GB)
Model sintesis suara TTS: file generator dan vocabulary untuk masing-masing dari 1107 bahasa
Model identifikasi bahasa LID: 126, 256, 512, 1024, 2048, 4017 model dan kamus

3 komentar

kuroneko 2023-05-24

Akhir-akhir ini tampaknya banyak model pengenalan suara dan TTS yang bermunculan.
Sepertinya hari ketika performa di bidang ini meningkat besar juga sudah tidak lama lagi.

Tapi kalau seseorang penganut Kristen, apakah tingkat pengenalan suaranya akan naik? 🤔

koyokr 2023-05-24

wkwkwk

cosine20 2023-05-24

......

MMS - Proyek teknologi suara 1000+ bahasa yang dirilis Meta

File model yang dapat diunduh

Bacaan terkait

3 komentar