Open source untuk mengkloning suara secara real-time hanya dengan 5 detik suara seseorang
(github.com)Implementasi dari makalah Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS).
Implementasi dari makalah Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS).
2 komentar
Kalau teknologi sintesis wajah dan sintesis suara terus berkembang, pada akhirnya makna dari penampilan dan suara itu sendiri mungkin akan berubah. Identitas seseorang tidak lagi bisa ditentukan hanya dari hal-hal yang bersifat fisik dan material. Sepertinya akan datang era yang lebih berfokus pada jiwa dan esensi manusia.
Video demo YouTube: https://www.youtube.com/watch?v=-O_hYhToKoA