Lumiere: Model Difusi Ruang-Waktu untuk Pembuatan Video yang Realistis
(lumiere-video.github.io)Teks-ke-video
- Tim riset Google memperkenalkan model difusi teks-ke-video bernama Lumiere.
- Model ini berfokus pada sintesis video yang menampilkan gerakan yang realistis, beragam, dan konsisten.
- Dengan menggunakan arsitektur space-time U-Net, model ini menghasilkan seluruh durasi video sekaligus.
Gambar-ke-video
- Dengan Lumiere, video dengan gaya yang dituju dapat dibuat menggunakan satu gambar referensi.
- Model ini memanfaatkan bobot model teks-ke-gambar yang telah di-fine-tune.
Stylisasi video
- Melalui Lumiere, metode pengeditan gambar berbasis teks yang sudah ada dapat digunakan untuk pengeditan video yang konsisten.
Cinemagraph
- Model Lumiere dapat menganimasikan konten gambar dalam area tertentu yang diberikan oleh pengguna.
Inpainting video
- Model Lumiere dapat memulihkan konten video yang dimask untuk menghasilkan video yang lengkap.
Penulis dan ucapan terima kasih
- Tim riset terdiri dari para penulis bersama dari Google Research dan beberapa universitas.
- Mereka menyampaikan terima kasih kepada para penulis yang berkontribusi melalui program magang, serta kepada berbagai pihak yang memberikan kolaborasi dan dukungan.
Pendapat GN⁺:
- Model Lumiere menandai kemajuan penting di bidang sintesis video. Kemampuan menghasilkan video dengan gerakan yang realistis dan beragam akan sangat membantu kreator konten dan editor video.
- Teknologi ini khususnya dapat berkontribusi dalam memperkuat penceritaan visual di industri film maupun periklanan, serta memperluas ekspresi kreatif.
- Pengembangan Lumiere menunjukkan bagaimana alat kreasi berbasis kecerdasan buatan sedang mengubah pekerjaan kreatif.
1 komentar
Komentar Hacker News