- Dapat menghasilkan suara seperti "anjing menggonggong di taman", "suara siulan saat angin bertiup", dan "seorang pria berpidato di depan banyak orang yang bersorak"
- Pembuatan audio memiliki berbagai tantangan
- Sulit memisahkan objek yang menghasilkan suara, dan hal ini menjadi lebih rumit karena beragam kondisi perekaman di lingkungan nyata; selain itu, anotasi untuk situasi semacam ini juga kurang sehingga sulit mengakumulasi model
- Untuk mengurangi masalah ini, diusulkan teknik augmentasi yang mencampurkan berbagai sampel audio dan membuat model mempelajari secara internal teknik untuk memisahkan beberapa sumber
Belum ada komentar.