4 poin oleh xguru 2021-05-24 | Belum ada komentar. | Bagikan ke WhatsApp
  • Framework pengenalan ucapan buatan tim AI Facebook

  • Mendukung pengenalan berbagai bahasa tanpa data ucapan yang ditranskripsikan

→ Kinerjanya mirip dengan model supervised learning yang dilatih dengan sekitar 1000 jam ucapan

→ Diuji pada bahasa seperti Swahili/Tatar yang tidak memiliki banyak data ucapan transkripsi

  • Metode yang mempelajari struktur audio tanpa label

→ Membagi rekaman ucapan menjadi unit ucapan yang secara longgar berkorespondensi dengan masing-masing bunyi

cat berisi tiga bunyi: "/K/", "/AE/", "/T/"

→ Dilatih dengan GAN yang terdiri dari generator dan discriminator

  • Kode dan makalah telah dipublikasikan

Belum ada komentar.

Belum ada komentar.