- Kitten TTS adalah model TTS (text-to-speech) open-source yang mengejar bobot ringan dan kualitas suara tinggi secara bersamaan
- Hanya menggunakan 15 juta parameter sehingga ukuran modelnya kurang dari 25MB
- Berbeda dari TTS besar lainnya, keunggulan utamanya adalah dapat dijalankan di semua lingkungan seperti mobile dan embedded
- Bahkan tanpa GPU, sintesis suara berkualitas tinggi dapat diproses di semua perangkat
- Menyediakan berbagai opsi suara premium sehingga mendukung sintesis suara berkualitas tinggi yang mirip dengan suara asli
- Inferensi suara dapat dilakukan dengan cepat sehingga dioptimalkan untuk sintesis real-time
- Model pratinjau pengembang telah dirilis, dan ke depannya bobot model lengkap yang sudah selesai dilatih, SDK mobile, versi web, dan lainnya akan dirilis secara bertahap
Belum ada komentar.