-
Framework pengenalan ucapan buatan tim AI Facebook
-
Mendukung pengenalan berbagai bahasa tanpa data ucapan yang ditranskripsikan
→ Kinerjanya mirip dengan model supervised learning yang dilatih dengan sekitar 1000 jam ucapan
→ Diuji pada bahasa seperti Swahili/Tatar yang tidak memiliki banyak data ucapan transkripsi
- Metode yang mempelajari struktur audio tanpa label
→ Membagi rekaman ucapan menjadi unit ucapan yang secara longgar berkorespondensi dengan masing-masing bunyi
→ cat berisi tiga bunyi: "/K/", "/AE/", "/T/"
→ Dilatih dengan GAN yang terdiri dari generator dan discriminator
- Kode dan makalah telah dipublikasikan
Belum ada komentar.