16 poin oleh xguru 2023-05-24 | 3 komentar | Bagikan ke WhatsApp
  • Massively Multilingual Speech
  • Proyek untuk membuat satu model suara yang mendukung ribuan bahasa, melampaui model pengenalan suara yang sebelumnya hanya mendukung sekitar 100 bahasa, menuju lebih dari 7000 bahasa yang digunakan di bumi
  • Menyediakan 1100+ model pengenalan suara multibahasa (ASR) dan model sintesis suara (TTS), 4000+ model identifikasi bahasa (LID), serta 1400+ model pra-pelatihan bahasa
  • Bertujuan agar orang dapat mengakses dan menggunakan informasi dalam bahasa yang mereka inginkan langsung di perangkat
  • Sebagai bagian dari proyek, dibangun dataset pembacaan Perjanjian Baru untuk 1100 bahasa dengan rata-rata 32 jam per bahasa, lalu memperluas bahasa yang dapat digunakan menjadi 4000 dengan memanfaatkan berbagai rekaman dokumen Kristen yang tidak berlabel

File model yang dapat diunduh

  • Model pre-trained: MMS-300M (3.5GB) dan MMS-1B (10GB)
  • Model pengenalan suara ASR dan kamus tersedia: MMS-1B:FL102 (102 bahasa, 4.5GB), MMS-1B:L1107 (1107 bahasa, 13GB), MMS-1B-all (1162 bahasa, 13.7GB)
  • Model sintesis suara TTS: file generator dan vocabulary untuk masing-masing dari 1107 bahasa
  • Model identifikasi bahasa LID: 126, 256, 512, 1024, 2048, 4017 model dan kamus

3 komentar

 
kuroneko 2023-05-24

Akhir-akhir ini tampaknya banyak model pengenalan suara dan TTS yang bermunculan.
Sepertinya hari ketika performa di bidang ini meningkat besar juga sudah tidak lama lagi.

Tapi kalau seseorang penganut Kristen, apakah tingkat pengenalan suaranya akan naik? 馃

 
koyokr 2023-05-24

wkwkwk

 
cosine20 2023-05-24

......