- Tim peneliti ByteDance mengembangkan sistem AI yang "menghasilkan video seseorang yang berbicara, bernyanyi, dan bergerak secara alami menggunakan satu foto"
- Melampaui keterbatasan model AI sebelumnya yang hanya dapat menganimasikan wajah atau tubuh bagian atas, sistem ini dapat menghasilkan "video yang mencerminkan gerakan seluruh tubuh"
- Ini adalah model terpadu pertama yang "memanfaatkan input audio, video, atau kombinasi keduanya" untuk menganimasikan gerakan manusia secara realistis
- Fitur utama
- Pembuatan video berbasis satu gambar
- Hanya dengan satu foto seseorang, dapat menghasilkan video alami yang mencerminkan gerakan seluruh tubuh
- Dukungan input multimodal
- Mendukung metode input audio, video, atau gabungan keduanya
- Ekspresi gestur meningkat signifikan dibanding model sebelumnya
- Dapat memproses gambar dengan rasio apa pun
- Mendukung berbagai rasio gambar seperti foto potret vertikal, foto setengah badan, dan foto seluruh tubuh
- Kompatibel dengan berbagai gaya dan data input
- Dapat mencerminkan beragam gaya seperti kartun, karakter buatan, hewan, dan pose kompleks
- Ekspresi gerak tubuh alami sesuai gaya musik
- Dapat menghasilkan gerakan yang sesuai dengan nada tinggi, nada rendah, dan berbagai genre musik
- Dapat meniru gerakan berbasis video
- Mendukung video driving untuk mereproduksi gerakan orang tertentu secara langsung
2 komentar
Wah, kalau nanti Tiongkok berperang, sepertinya video propaganda palsu yang dimanipulasi bakal bermunculan di mana-mana.
Wah... ini keren banget, ya?