wav2vec-U: Pengenalan ucapan berkinerja tinggi tanpa memerlukan supervisi

xguru · 2021-05-24T09:20:05+09:00

Framework pengenalan ucapan buatan tim AI Facebook Mendukung pengenalan berbagai bahasa tanpa data ucapan yang ditranskripsikan → Kinerjanya mirip dengan model supervised learning yang dilatih dengan sekitar 1000 jam ucapan → Diuji pada bahasa seperti Swahili/Tatar yang tidak memiliki banyak data ucapan transkripsi Metode yang mempelajari struktur audio tanpa label → Membagi rekaman ucapan menjadi unit ucapan yang secara longgar berkorespondensi dengan masing-masing bunyi → cat berisi tiga bunyi: "/K/", "/AE/", "/T/" → Dilatih dengan GAN yang terdiri dari generator dan discriminator Kode dan makalah telah dipublikasikan

(ai.facebook.com)

4 poin oleh xguru 2021-05-24 | Belum ada komentar. | Bagikan ke WhatsApp

Framework pengenalan ucapan buatan tim AI Facebook
Mendukung pengenalan berbagai bahasa tanpa data ucapan yang ditranskripsikan

→ Kinerjanya mirip dengan model supervised learning yang dilatih dengan sekitar 1000 jam ucapan

→ Diuji pada bahasa seperti Swahili/Tatar yang tidak memiliki banyak data ucapan transkripsi

Metode yang mempelajari struktur audio tanpa label

→ Membagi rekaman ucapan menjadi unit ucapan yang secara longgar berkorespondensi dengan masing-masing bunyi

→ cat berisi tiga bunyi: "/K/", "/AE/", "/T/"

→ Dilatih dengan GAN yang terdiri dari generator dan discriminator

Kode dan makalah telah dipublikasikan

wav2vec-U: Pengenalan ucapan berkinerja tinggi tanpa memerlukan supervisi

Bacaan terkait

Belum ada komentar.