ElevenLabs Voice Isolator - Memisahkan hanya suara dengan bersih
(elevenlabs.io)- Menghapus kebisingan latar dari film, podcast, wawancara, dan lainnya, lalu mengekstrak hanya suara dengan bersih
- Ukuran maksimum yang didukung adalah 500MB dan audio hingga durasi 1 jam
- Tidak dirancang atau dioptimalkan untuk vokal musik (namun bisa berhasil tergantung kontennya)
- API untuk streaming real-time masih belum dirilis, tetapi akan segera tersedia
- Biaya penggunaan adalah 1000 karakter per menit audio
6 komentar
Apa maksudnya ini? Saya tidak paham kenapa jumlah karakter disebutkan.
Bukankah ini konsep yang mirip seperti token?
Seperti di GPT, gambar juga dihitung seperti text token.
Melihat layanan lain yang disediakan perusahaan ini, jadi bisa dimengerti. Sepertinya mereka memakai metode Speech to text to Speech, jadi mereka mengenakan biaya untuk teks perantara tersebut.
Sementara itu, MVSep yang menyediakan pemisahan vokal melalui berbagai model terbuka, baik gratis maupun berbayar, juga menawarkan beberapa jenis model pemisahan suara/kebisingan.
https://mvsep.com
Adobe Podcast AI juga menyediakan fitur serupa. Sepertinya ada juga versi gratisnya https://podcast.adobe.com/enhance
Berdasarkan versi gratisnya, rasanya bahasa Korea belum dioptimalkan dengan baik..