VideoLDM - Sintesis Text-to-Video Resolusi Tinggi menggunakan Latent Diffusion Model

xguru · 2023-04-22T10:18:01+09:00

LDM memungkinkan sintesis gambar resolusi tinggi dengan melatih Diffusion Model di ruang latent berdimensi rendah yang terkompresi, tanpa membutuhkan banyak sumber daya komputasi Makalah dari NVIDIA yang menerapkan LDM ini pada video resolusi tinggi LDM diprapelajari khusus untuk gambar, lalu diperkenalkan Temporal Dimension dan dilakukan fine-tuning pada urutan gambar yang telah dienkode untuk mengubah generator gambar menjadi generator video Menyelaraskan upsampler diffusion model untuk mengubahnya menjadi model video ultra-resolusi tinggi yang temporally consistent

(research.nvidia.com)

7 poin oleh xguru 2023-04-22 | Belum ada komentar. | Bagikan ke WhatsApp

LDM memungkinkan sintesis gambar resolusi tinggi dengan melatih Diffusion Model di ruang latent berdimensi rendah yang terkompresi, tanpa membutuhkan banyak sumber daya komputasi
Makalah dari NVIDIA yang menerapkan LDM ini pada video resolusi tinggi
LDM diprapelajari khusus untuk gambar, lalu diperkenalkan Temporal Dimension dan dilakukan fine-tuning pada urutan gambar yang telah dienkode untuk mengubah generator gambar menjadi generator video
Menyelaraskan upsampler diffusion model untuk mengubahnya menjadi model video ultra-resolusi tinggi yang temporally consistent

VideoLDM - Sintesis Text-to-Video Resolusi Tinggi menggunakan Latent Diffusion Model

Bacaan terkait

Belum ada komentar.