- Tetap menggunakan SD 1.5 apa adanya, lalu melakukan fine-tuning pada model agar menghasilkan gambar Spectrogram dengan menggunakan img2txt
- Gambar yang dihasilkan dapat dikonversi menjadi klip audio yang bisa diputar
- Suara dapat dimodifikasi dengan menggunakan img2img
- Mendukung interpolasi agar klip audio pendek dapat di-loop tanpa batas
- Dibuat sebagai aplikasi web agar mudah digunakan, dan kodenya juga dibuka (Next.js + React + Three.js + Tailwind)
Spectrogram : Waveform + Spectrum
- Representasi visual spektrum suara menggunakan frekuensi, amplitudo (intensitas), dan waktu
- Dapat dihitung dari audio menggunakan STFT (Short-Time Fourier Transform)
Belum ada komentar.