10 poin oleh xguru 2022-12-16 | Belum ada komentar. | Bagikan ke WhatsApp
  • Tetap menggunakan SD 1.5 apa adanya, lalu melakukan fine-tuning pada model agar menghasilkan gambar Spectrogram dengan menggunakan img2txt
  • Gambar yang dihasilkan dapat dikonversi menjadi klip audio yang bisa diputar
  • Suara dapat dimodifikasi dengan menggunakan img2img
  • Mendukung interpolasi agar klip audio pendek dapat di-loop tanpa batas
  • Dibuat sebagai aplikasi web agar mudah digunakan, dan kodenya juga dibuka (Next.js + React + Three.js + Tailwind)

Spectrogram : Waveform + Spectrum

  • Representasi visual spektrum suara menggunakan frekuensi, amplitudo (intensitas), dan waktu
  • Dapat dihitung dari audio menggunakan STFT (Short-Time Fourier Transform)

Belum ada komentar.

Belum ada komentar.