Google Universal Speech Model (USM): Speech AI mutakhir yang mendukung lebih dari 100 bahasa

xguru · 2023-03-10T11:16:01+09:00

Sedang melanjutkan "Inisiatif 1.000 Bahasa" yang dimulai pada November tahun lalu (membuat model machine learning yang mendukung 1.000 bahasa) Saat ini, USM dilatih dengan 2B (2 miliar) parameter, lebih dari 300 bahasa, 12 juta jam suara, dan 28 miliar kalimat Digunakan di YouTube untuk pembuatan subtitle. Mendukung bukan hanya bahasa Inggris/Tionghoa, tetapi juga bahasa seperti Amharic, Cebuano, Assamese, dan Azerbaijani Dua tantangan penting untuk mencapai tujuan Metode supervised learning yang ada kurang skalabel Membuat model secara efisien untuk menambah jumlah bahasa Pendekatan: self-supervised learning with fine-tuning (pembelajaran mandiri dengan fine-tuning) Makalah dan API (hanya peneliti yang dapat mendaftar) telah dipublikasikan

(ai.googleblog.com)

8 poin oleh xguru 2023-03-10 | 1 komentar | Bagikan ke WhatsApp

Sedang melanjutkan "Inisiatif 1.000 Bahasa" yang dimulai pada November tahun lalu (membuat model machine learning yang mendukung 1.000 bahasa)
Saat ini, USM dilatih dengan 2B (2 miliar) parameter, lebih dari 300 bahasa, 12 juta jam suara, dan 28 miliar kalimat
Digunakan di YouTube untuk pembuatan subtitle. Mendukung bukan hanya bahasa Inggris/Tionghoa, tetapi juga bahasa seperti Amharic, Cebuano, Assamese, dan Azerbaijani
Dua tantangan penting untuk mencapai tujuan
- Metode supervised learning yang ada kurang skalabel
- Membuat model secara efisien untuk menambah jumlah bahasa
Pendekatan: self-supervised learning with fine-tuning (pembelajaran mandiri dengan fine-tuning)
Makalah dan API (hanya peneliti yang dapat mendaftar) telah dipublikasikan

1 komentar

wedding 2023-03-10

Saya rasa ini adalah teknologi yang baik agar bahasa dan dialek yang perlahan menghilang tetap bisa digunakan oleh generasi mendatang.

Google Universal Speech Model (USM): Speech AI mutakhir yang mendukung lebih dari 100 bahasa

Bacaan terkait

1 komentar