MetaVoice-1B - model Text-To-Speech 1,2 miliar parameter
(github.com/metavoiceio)- Model TTS (text-to-speech) dengan 1,2 miliar parameter yang dilatih menggunakan 100 ribu jam suara
- Ritme dan intonasi bicara yang emosional (bahasa Inggris)
- Mendukung voice cloning melalui fine-tuning (untuk penutur India, berhasil hanya dengan sekitar 1 menit data suara)
- Untuk suara AS/Inggris, zero-shot cloning dimungkinkan hanya dengan 30 detik audio referensi
- Mendukung sintesis suara panjang
- Dapat digunakan tanpa batasan di bawah lisensi Apache 2.0
Belum ada komentar.