8 poin oleh xguru 2025-02-19 | 2 komentar | Bagikan ke WhatsApp

Apa itu Audiblez?

  • Alat untuk mengubah ebook .epub menjadi audiobook .m4b
  • Menggunakan sintesis suara berkualitas tinggi berbasis Kokoro-82M
  • Tersedia dengan lisensi Apache dan dilatih dengan data audio kurang dari 100 jam
  • Di GPU T4 Google Colab, dapat mengonversi "Animal Farm" dalam sekitar 5 menit dengan "kecepatan konversi 600 karakter per detik"
  • Di M2 MacBook Pro (mode CPU), membutuhkan "sekitar 1 jam dengan kecepatan 60 karakter per detik"
    • Saat ini tidak ada dukungan CUDA di Apple Silicon (M1, M2) (menunggu dukungan MLX)

Pembaruan utama Audiblez 4.2

  • Dukungan GUI multi-platform berbasis wxWidgets (Mac, Windows, Linux)
  • Dukungan untuk berbagai bahasa (Inggris, Spanyol, Prancis, Hindi, Italia, Jepang, Portugis, Tionghoa)
  • Beralih dari ONNX ke basis Torch dengan menggunakan paket kokoro
  • Dukungan akselerasi CUDA (namun di Apple Silicon berjalan dalam mode CPU)
  • Menyertakan gambar sampul dan cap waktu bab di audiobook
  • Peningkatan dukungan Windows

2 komentar

 
xguru 2025-02-19

Mengubah ebook menjadi audiobook dengan model Kokoro-82M
Ini berbasis itu, tetapi dukungan bahasa Korea yang disertakan di sana tampaknya tidak ada di Audiblez (meski di komentar memang ada yang bilang kualitas bahasa Korea di Kokoro kurang bagus)

 
inosphe 2025-02-19

Jika melihat catatan lama proyek kokoro, jelas dulu ada voice bahasa Korea, tetapi melihat diskusi di sisi Discord, tampaknya mereka mengalami kesulitan untuk distribusi karena klausul larangan ekspor data ke luar negeri dari AI Hub Korea...