Meta mengumumkan keluarga model Seamless Communication
(ai.meta.com)- Sekelompok model riset AI yang menghilangkan hambatan antarbahasa dan memungkinkan komunikasi multibahasa yang lebih alami
- SeamlessExpressive: mempertahankan ekspresi dan nuansa bahasa lintas bahasa
- SeamlessStreaming: menyediakan terjemahan suara dan teks dengan latensi sekitar 2 detik
- SeamlessM4T v2: model fondasi multibahasa dan multitugas yang mendukung komunikasi melalui suara dan teks
- Seamless: mengintegrasikan fungsi SeamlessExpressive, SeamlessStreaming, dan SeamlessM4T v2 dalam satu kesatuan
Mempertahankan nuansa ekspresi
- SeamlessExpressive bertujuan menghasilkan terjemahan yang menangkap nuansa ekspresi manusia
- Alat terjemahan yang ada mahir menangkap isi percakapan, tetapi umumnya menghasilkan suara yang datar dan terasa robotik
- SeamlessExpressive berupaya mempertahankan bukan hanya gaya bicara dan warna emosional, tetapi juga nuansa bahasa seperti kecepatan berbicara dan jeda
Terjemahan hampir real-time
- SeamlessStreaming adalah model multibahasa skala besar pertama yang menyediakan terjemahan dengan latensi sekitar 2 detik
- Dibangun di atas SeamlessM4T v2, dan mendukung pengenalan suara otomatis serta terjemahan suara-ke-teks untuk hampir 100 bahasa input dan output
- Selain itu, juga mendukung terjemahan suara-ke-suara untuk hampir 100 bahasa input dan 36 bahasa output
Model dasar untuk terjemahan universal
- Pada Agustus 2023, Meta memperkenalkan versi pertama SeamlessM4T, yang menghadirkan hasil mutakhir dalam terjemahan dan transkripsi untuk suara maupun teks
- Model yang ditingkatkan berdasarkan itu, SeamlessM4T v2, menjadi fondasi bagi model baru SeamlessExpressive dan SeamlessStreaming
- Mengusung arsitektur baru dan decoder teks-ke-unit non-autoregresif untuk meningkatkan konsistensi antara keluaran teks dan suara
Pendekatan riset
- Meta percaya pada kekuatan kolaborasi dan riset terbuka, dan merilis seluruh model Seamless Communication agar para peneliti dapat terus mengembangkannya
- Untuk mendorong ekosistem AI yang aman dan bertanggung jawab, Meta secara signifikan mengurangi dampak toksisitas halusinasi dalam terjemahan, serta menerapkan pendekatan watermarking khusus pada keluaran audio model ekspresif
Opini GN⁺
Hal terpenting dalam artikel ini adalah pengenalan model AI Seamless Communication yang dikembangkan Meta untuk meruntuhkan hambatan bahasa. Model-model ini menawarkan terjemahan yang hampir real-time sambil tetap menjaga nuansa ekspresi, serta memiliki kemampuan kuat untuk mendukung beragam bahasa. Kemajuan teknologi ini membuka jalan agar orang-orang di seluruh dunia dapat berkomunikasi dengan cara yang lebih alami dan autentik, sehingga menjadi kabar yang menarik dan memikat bagi banyak orang.
1 komentar
Komentar Hacker News
Harapan terhadap teknologi masa depan yang menjanjikan
Harapan terhadap alat pembelajaran bahasa yang memanfaatkan teknologi
Potensi teknologi streaming real-time
Kekhawatiran tentang akurasi terjemahan
Kesadaran akan perubahan industri oleh AI
Perkembangan teknologi text-to-speech dan harapan ke depan
Keluhan tentang kurangnya dukungan untuk bahasa tertentu
Sorotan atas kurangnya data bahasa
Ungkapan tentang kesalahan penerjemah
Kekaguman terhadap perkembangan teknologi terjemahan AI