- Makalah yang dipublikasikan oleh Google Research
- Menghasilkan musik yang sangat setia pada deskripsi teks seperti "melodi biola yang tenang dengan riff gitar terdistorsi sebagai latar"
- Menghasilkan musik berdurasi beberapa menit pada 24kHz dengan memformulasikannya sebagai tugas pemodelan antarsekuens hierarkis
- Jauh lebih unggul daripada sistem sebelumnya dalam hal kualitas audio maupun kepatuhan terhadap deskripsi teks
- Juga dapat mentransformasikan gaya melodi dari siulan atau humming
- Dengan memberikan beberapa prompt secara berurutan, audio dapat dihasilkan dalam mode cerita
- Merilis dataset MusicCaps yang terdiri dari 5,5 ribu pasangan musik-teks
Belum ada komentar.