Google merilis AI text-to-video "Imagen Video"

xguru · 2022-10-07T10:52:01+09:00

"Text-conditional Video Generation System" yang membuat video dari masukan teks menggunakan Video Diffusion Model Ciri khasnya adalah membuat video beresolusi rendah (24x48 piksel, 16 frame, 3fps) dari teks, lalu melakukan upscaling dengan menumpuk 7 model difusi secara berjenjang (cascade) Output akhir adalah 1280x768 24fps. Dapat menghasilkan video berdurasi 5,3 detik Makalah: Imagen Video : High Definition Video Generation with Diffusion Models

(imagen.research.google)

9 poin oleh xguru 2022-10-07 | 1 komentar | Bagikan ke WhatsApp

"Text-conditional Video Generation System" yang membuat video dari masukan teks menggunakan Video Diffusion Model
Ciri khasnya adalah membuat video beresolusi rendah (24x48 piksel, 16 frame, 3fps) dari teks, lalu melakukan upscaling dengan menumpuk 7 model difusi secara berjenjang (cascade)
Output akhir adalah 1280x768 24fps. Dapat menghasilkan video berdurasi 5,3 detik
Makalah: Imagen Video : High Definition Video Generation with Diffusion Models

1 komentar

xguru 2022-10-07

Imagen - model difusi text-to-image dari Google
Imagen-pytorch - implementasi Google Imagen dengan Pytorch
Make-A-Video : AI yang membuat video dari teks

Google merilis AI text-to-video "Imagen Video"

Bacaan terkait

1 komentar