8 poin oleh xguru 2023-12-12 | 1 komentar | Bagikan ke WhatsApp
  • Menghasilkan suara dan efek suara dengan menggabungkan masukan suara dan prompt teks bahasa alami
    • Memungkinkan pembuatan audio khusus dengan mudah untuk berbagai kasus penggunaan
  • Dengan menyempurnakan Voicebox yang diperkenalkan awal tahun ini, Meta mengintegrasikan kemampuan pembuatan dan pengeditan untuk suara, efek suara (suara pendek dan terputus-putus seperti gonggongan anjing, klakson mobil, suara guntur, dll.), dan soundscape, serta memaksimalkan tingkat kendali untuk tiap kasus penggunaan melalui berbagai mekanisme input
  • Dapat menggunakan prompt bahasa alami untuk menjelaskan jenis suara atau tipe vokal yang ingin dihasilkan
    • Dapat membuat soundscape dengan prompt seperti "air sungai yang mengalir dan kicau burung"
    • Dapat menghasilkan suara yang diinginkan dengan memasukkan "seorang perempuan muda berbicara dengan nada tinggi dan kecepatan cepat"
  • Dengan menggabungkan input suara audio dan prompt gaya teks, model ini dapat mensintesis suara tersebut ke dalam lingkungan apa pun (misalnya "di dalam katedral") atau emosi apa pun (misalnya "berbicara pelan dengan sedih")
    • Model pertama yang mendukung masukan ganda (prompt suara dan prompt deskripsi teks) untuk perubahan gaya suara bentuk bebas
  • Menunjukkan kinerja lebih dari 30% lebih baik daripada Voicebox dalam hal kemiripan gaya di berbagai gaya suara
  • Meta membuka Audiobox bagi peneliti terpilih dan institusi akademik yang telah memiliki rekam jejak di bidang riset suara, untuk membantu memajukan teknologi mutakhir di bidang ini dan mengamankan beragam mitra yang dapat menangani aspek AI yang bertanggung jawab dari pekerjaan ini