- Veo 2 adalah model pembuatan video mutakhir yang menawarkan gerakan realistis dan output berkualitas tinggi hingga 4K
- Dapat mengeksplorasi berbagai gaya dan menemukan gaya sendiri melalui kontrol kamera yang luas
- Mendefinisikan ulang kualitas dan kontrol
- Veo 2 dengan setia mengikuti instruksi yang sederhana maupun kompleks, serta mensimulasikan fisika dunia nyata dan beragam gaya visual secara meyakinkan
- Realisme dan fidelitas yang ditingkatkan: Meningkat signifikan dibanding model video AI lain dalam hal detail, realisme, dan pengurangan artefak
- Kemampuan motion tingkat lanjut: Berkat pemahaman terhadap fisika dan kemampuan mengikuti instruksi terperinci, Veo 2 mengekspresikan gerakan dengan akurasi tinggi
- Lebih banyak opsi kontrol kamera: Menginterpretasikan dan menghasilkan berbagai gaya pengambilan gambar, sudut, dan pergerakan secara akurat
- Benchmark
- Dalam perbandingan dengan model pembuatan video papan atas lainnya, Veo mencapai hasil mutakhir menurut para evaluator manusia
- 1003 prompt beserta video terkait dievaluasi di MovieGenBench, dan Veo 2 menunjukkan kinerja terbaik dalam preferensi keseluruhan serta kemampuan mengikuti prompt secara akurat
- Keterbatasan
- Veo 2 telah menunjukkan kemajuan luar biasa dalam menghasilkan video yang realistis, dinamis, dan kompleks, namun mempertahankan konsistensi penuh pada adegan kompleks atau adegan dengan gerakan rumit masih menjadi tantangan
- Ada rencana untuk terus mengembangkan dan meningkatkan performa di area-area tersebut
1 komentar
Komentar Hacker News
Pengguna membagikan umpan balik tentang video yang dibuat dengan prompt "A pelican riding a bicycle along a coastal path overlooking a harbor". Dari empat versi, dua menampilkan pelikan yang mengendarai sepeda, satu pelikan berlari di jalan, satu pelikan duduk di atas sepeda, dan yang terakhir adalah pelikan dengan helm aneh. Hasilnya lebih baik daripada Sora
Kemenangan 2:1 atas Sora Turbo dalam preferensi pengguna cukup mengesankan. Ada batasan yang mirip dengan Sora, tetapi tampaknya sedikit lebih baik dalam meniru gerakan alami dan fisika. Dalam postingan blog dijelaskan bahwa model ini dapat diskalakan hingga resolusi 4K dan durasinya bisa diperpanjang sampai beberapa menit
Ada rasa penasaran tentang kemiripan antara contoh yang diberikan dalam pengumuman dan data pelatihannya. Muncul pertanyaan seberapa jauh detail dalam prompt benar-benar tercermin dalam hasil. Misalnya, ada yang bertanya-tanya bagaimana deskripsi tentang karisma seorang DJ dan kekuatan musik memengaruhi video tersebut
Video skateboard tampak tidak realistis, tetapi beberapa video lain terlihat sangat meyakinkan
Disebutkan bahwa halaman tersebut crash di Chrome pada iPad
Setelah pengumuman besar Google, OpenAI merilis pratinjau Sora dan sempat mengungguli Google, tetapi Veo 2 tampaknya lebih maju daripada Sora
Seorang teman yang bekerja di stasiun TV sudah menggunakan alat seperti ini untuk program iklan layanan masyarakat
Ada anggapan bahwa Google mungkin akan mendominasi transisi dari teks/gambar ke video berkat aksesibilitasnya terhadap YouTube
Ada kebingungan soal durasi sampel Veo 2 yang 8 detik, durasi sampel VideoGen yang 10 detik, dan model lain yang 5 detik. Muncul pertanyaan apakah hasil positif Veo 2 dipengaruhi oleh penilai yang lebih menyukai video yang lebih panjang
Divisi AI Google diibaratkan seperti kapal selam nuklir raksasa dibanding yacht mencolok milik OpenAI. Ada dugaan bahwa Google mungkin sudah semakin dekat ke AGI, sambil juga menyinggung situasi Microsoft dan Amazon