24 poin oleh xguru 2023-04-24 | 2 komentar | Bagikan ke WhatsApp
  • Mampu menghasilkan suara multibahasa yang sangat realistis
  • Mencakup musik, kebisingan latar, dan efek suara sederhana
  • Juga dapat menampilkan komunikasi nonverbal seperti tawa, helaan napas, dan tangisan
  • Mendukung bahasa Inggris/Korea serta Jerman/Prancis/Jepang/Tionghoa dan lainnya
  • Menggunakan codec EnCodec dari Facebook
  • Bark berlisensi CC-BY 4.0 NC, dan model Suno sendiri dapat digunakan untuk keperluan komersial

2 komentar

 
dlehals2 2023-04-24

Generasi Bark terkadang berbeda dari prompt saya. Apa yang terjadi?
Bark adalah model bergaya GPT. Karena itu, model ini bisa mengambil sedikit kebebasan kreatif dalam hasil generasinya, sehingga output model memiliki variasi yang lebih tinggi dibandingkan pendekatan text-to-speech tradisional.

Bagian ini agak menyeramkan ya, hehe, jadi alasan kenapa kadang hasilnya berbeda dari prompt adalah demi semacam kebebasan kreatif model...

 
kuroneko 2023-04-24

Menarik juga bahwa model ini cukup bagus dalam menghasilkan bahasa Korea.