OmniHuman - Model yang menghasilkan video realistis dari satu foto

xguru · 2025-02-13T10:28:01+09:00

Tim peneliti ByteDance mengembangkan sistem AI yang "menghasilkan video seseorang yang berbicara, bernyanyi, dan bergerak secara alami menggunakan satu foto" Melampaui keterbatasan model AI sebelumnya yang hanya dapat menganimasikan wajah atau tubuh bagian atas, sistem ini dapat menghasilkan "video yang mencerminkan gerakan seluruh tubuh" Ini adalah model terpadu pertama yang "memanfaatkan input audio, video, atau kombinasi keduanya" untuk menganimasikan gerakan manusia secara realistis Fitur utama Pembuatan video berbasis satu gambar Hanya dengan satu foto seseorang, dapat menghasilkan video alami yang mencerminkan gerakan seluruh tubuh Dukungan input multimodal Mendukung metode input audio, video, atau gabungan keduanya Ekspresi gestur meningkat signifikan dibanding model sebelumnya Dapat memproses gambar dengan rasio apa pun Mendukung berbagai rasio gambar seperti foto potret vertikal, foto setengah badan, dan foto seluruh tubuh Kompatibel dengan berbagai gaya dan data input Dapat mencerminkan beragam gaya seperti kartun, karakter buatan, hewan, dan pose kompleks Ekspresi gerak tubuh alami sesuai gaya musik Dapat menghasilkan gerakan yang sesuai dengan nada tinggi, nada rendah, dan berbagai genre musik Dapat meniru gerakan berbasis video Mendukung video driving untuk mereproduksi gerakan orang tertentu secara langsung

(omnihuman-lab.github.io)

20 poin oleh xguru 2025-02-13 | 2 komentar | Bagikan ke WhatsApp

Tim peneliti ByteDance mengembangkan sistem AI yang "menghasilkan video seseorang yang berbicara, bernyanyi, dan bergerak secara alami menggunakan satu foto"
Melampaui keterbatasan model AI sebelumnya yang hanya dapat menganimasikan wajah atau tubuh bagian atas, sistem ini dapat menghasilkan "video yang mencerminkan gerakan seluruh tubuh"
Ini adalah model terpadu pertama yang "memanfaatkan input audio, video, atau kombinasi keduanya" untuk menganimasikan gerakan manusia secara realistis
Fitur utama
- Pembuatan video berbasis satu gambar
  - Hanya dengan satu foto seseorang, dapat menghasilkan video alami yang mencerminkan gerakan seluruh tubuh
- Dukungan input multimodal
  - Mendukung metode input audio, video, atau gabungan keduanya
  - Ekspresi gestur meningkat signifikan dibanding model sebelumnya
- Dapat memproses gambar dengan rasio apa pun
  - Mendukung berbagai rasio gambar seperti foto potret vertikal, foto setengah badan, dan foto seluruh tubuh
- Kompatibel dengan berbagai gaya dan data input
  - Dapat mencerminkan beragam gaya seperti kartun, karakter buatan, hewan, dan pose kompleks
- Ekspresi gerak tubuh alami sesuai gaya musik
  - Dapat menghasilkan gerakan yang sesuai dengan nada tinggi, nada rendah, dan berbagai genre musik
- Dapat meniru gerakan berbasis video
  - Mendukung video driving untuk mereproduksi gerakan orang tertentu secara langsung

2 komentar

dhy0613 2025-02-13

Wah, kalau nanti Tiongkok berperang, sepertinya video propaganda palsu yang dimanipulasi bakal bermunculan di mana-mana.

colus001 2025-02-13

Wah... ini keren banget, ya?

OmniHuman - Model yang menghasilkan video realistis dari satu foto

Bacaan terkait

2 komentar