Stable Audio 2.0
(stability.ai)- Stable Audio 2.0 menetapkan standar baru untuk trek penuh berkualitas tinggi yang dihasilkan AI, hingga durasi 3 menit, dalam stereo 44.1kHz
- Memperkenalkan kemampuan generasi audio-to-audio yang memungkinkan pengguna mengunggah sampel dan mengubahnya menggunakan prompt bahasa alami
- Dilatih secara eksklusif menggunakan dataset berlisensi dari pustaka musik AudioSparx, sambil menghormati permintaan 'opt out' dari kreator dan menjamin kompensasi yang adil
- Pengguna dapat menjelajahi model di situs web Stable Audio dan mulai berkarya secara gratis
Fitur baru
- Dapat menghasilkan lagu hingga 3 menit, dengan komposisi terstruktur yang mencakup intro, perkembangan, dan outro, serta efek suara stereo
- Generasi Audio-To-Audio : Mendukung unggahan file audio untuk mengubah ide menjadi sampel yang diproduksi sepenuhnya. Ketentuan layanan mewajibkan hanya materi bebas hak cipta yang diunggah, dan sistem menggunakan pengenalan konten tingkat lanjut untuk mencegah pelanggaran hak cipta
- Pembuatan variasi dan efek suara : Meningkatkan produksi berbagai suara dan efek audio, mulai dari bunyi ketikan keyboard hingga sorakan kerumunan dan dengungan jalanan kota
- Peralihan gaya : Memodifikasi audio yang baru dibuat atau diunggah secara mulus dalam proses generasi agar sesuai dengan gaya dan nuansa tertentu dari proyek
Riset
- Arsitektur model latent diffusion dari Stable Audio 2.0 dirancang untuk memungkinkan generasi trek penuh yang terstruktur
- Untuk itu, semua komponen sistem disesuaikan guna meningkatkan performa dalam jangka waktu panjang
- Autoencoder baru yang sangat terkompresi memadatkan waveform audio mentah menjadi representasi yang jauh lebih pendek
- Diffusion Transformer (DiT) digunakan menggantikan U-Net sebelumnya, dan lebih mahir dalam memanipulasi data pada sekuens panjang
Pengaman
- Seperti model 1.0, versi 2.0 dilatih menggunakan data AudioSparx yang mencakup lebih dari 800.000 musik, efek suara, file stem instrumen tunggal, dan metadata teks terkait
- Semua artis di AudioSparx memiliki opsi untuk melakukan 'opt out' dari pelatihan model Stable Audio
- Untuk melindungi hak pemegang hak cipta, saat audio diunggah mereka bermitra dengan AudibleMagic dan menggunakan teknologi content recognition (ACR) mereka untuk mencegah pelanggaran hak cipta melalui pencocokan konten secara real-time
Stable Radio
-
Stable Radio adalah live stream 24/7 yang hanya menampilkan trek yang dihasilkan oleh Stable Audio, dan saat ini sedang streaming di kanal YouTube Stable Audio
-
Pengguna dapat menjelajahi model di situs web Stable Audio dan mulai berkarya secara gratis.
Opini GN⁺
- Stable Audio 2.0 memiliki potensi untuk membawa inovasi ke industri musik dengan menyediakan alat kreasi berbasis AI bagi para pembuat musik. Kemampuan memahami maksud pengguna melalui pemrosesan bahasa alami dan mengubahnya menjadi musik dapat menyederhanakan proses kreatif serta memberi lebih banyak orang kesempatan untuk ikut membuat musik.
- Salah satu masalah yang dapat dibawa teknologi ini adalah persoalan hak cipta. Meskipun perusahaan menyatakan telah mengambil langkah untuk mencegah pelanggaran hak cipta, persoalan hukum terkait kepemilikan hak cipta atas konten yang dihasilkan AI masih tetap kompleks.
- Salah satu hal yang perlu dipertimbangkan saat memperkenalkan AI ke produksi musik adalah persepsi terhadap orisinalitas dan nilai artistik musik yang dihasilkan AI. Perlu ada diskusi tentang apakah AI dapat meniru atau menggantikan kreativitas manusia, dan dampaknya terhadap industri musik.
- Manfaat yang bisa diperoleh dari penggunaan alat generasi musik AI mencakup pemangkasan waktu kreasi, eksperimen dengan berbagai gaya dan genre musik, serta memungkinkan kreator membuat musik tanpa harus memiliki pengetahuan mendalam tentang teori musik atau keterampilan memainkan instrumen.
- Jika mempertimbangkan dampak positif teknologi ini terhadap pendidikan musik, alat ini dapat membantu siswa yang mempelajari teori musik untuk mengeksplorasi dan memahami beragam gaya dan struktur musik.
1 komentar
Opini Hacker News