- AniSora adalah model AI pembuat video open-source yang dikembangkan oleh Bilibili dan mendukung beragam gaya seperti animasi, manga, dan VTuber
- Video animasi beresolusi tinggi dan berkualitas tinggi dapat dibuat dengan mudah dari gambar atau prompt teks
- Berdasarkan algoritme yang dikhususkan untuk manga dan animasi serta dataset berskala besar, model ini menghadirkan gerakan realistis dan hasil yang ekspresif
- Keunggulannya ada pada antarmuka intuitif dan lingkungan kolaborasi berbasis komunitas yang memungkinkan bahkan nonprofesional pun mudah memanfaatkannya
- Cocok untuk beragam kasus penggunaan seperti episode pendek, PV, VTuber, dan concept art
Apa itu AniSora
- AniSora adalah model pembuat video animasi open-source paling kuat yang dikembangkan oleh Bilibili
- Hanya dengan satu klik, pengguna dapat membuat video dalam berbagai gaya seperti serial animasi, animasi Tiongkok, adaptasi manga, VTuber, dan PV animasi
- Hanya dengan gambar atau prompt teks, adegan statis dapat diwujudkan menjadi animasi yang dinamis dan detail
- Riset dasar AniSora didasarkan pada makalah teknologi terbaru yang diterima di IJCAI’25
Contoh AniSora
- Video contoh yang dibuat dengan AniSora menunjukkan kemampuan untuk mengubah gambar diam menjadi animasi bergerak secara alami
- Contoh: rambut yang tertiup angin di dalam mobil, beberapa gadis mengangkat tangan sambil menari, motion blur gerakan karakter yang berlari sangat cepat, dan sebagainya
- Model ini mewujudkan secara realistis berbagai penyutradaraan yang dibutuhkan dalam manga dan animasi, seperti ekspresi emosi, dinamika gerak, dan transisi adegan
Keunggulan utama AniSora
Algoritme yang dioptimalkan untuk gaya animasi/manga
- Menggunakan struktur model khusus yang dilatih dengan dataset animasi dan manga berskala besar
- Dapat mereproduksi gaya visual dan penyutradaraan yang khas dengan akurat
- Memungkinkan output berkualitas tinggi yang mencerminkan karya asli manga terbaru hingga tren terkini
Antarmuka yang intuitif
- Dirancang agar bahkan pengguna yang tidak terbiasa dengan teknologi tetap bisa membuat video secara langsung
- Dengan satu klik, siapa pun dapat dengan mudah merasakan pengalaman membuat video manga dan VTuber
Dukungan video animasi berkualitas tinggi
- AniSora menyediakan output video 1080p berkualitas tinggi secara default
- Karena dioptimalkan untuk berbagai platform, video dapat dimanfaatkan di berbagai kanal seperti proyek, SNS, dan PV
Ringkasan FAQ AniSora
Apa itu AniSora?
- AniSora adalah model pembuat video animasi open-source yang dirilis Bilibili sebagai bagian dari Project Index-AniSora
- Hanya dengan gambar atau prompt teks, model ini dapat secara otomatis membuat video bergaya animasi beresolusi tinggi
- Model ini mencerminkan hasil riset terbaru yang menitikberatkan pada konsistensi gerakan dan daya ekspresi
Perbedaannya dengan alat pembuat video AI lain
- AniSora berfokus pada performa yang dioptimalkan untuk gaya animasi dan manga
- Sebagai proyek open-source berbasis komunitas dengan keahlian Bilibili, model ini dioptimalkan untuk pembuatan video bertujuan khusus seperti serial anime, adaptasi manga, dan VTuber
Apakah mendukung video & audio
- Saat ini AniSora adalah model yang berfokus pada pembuatan video
- Untuk ketersediaan fitur tambahan seperti sintesis audio, perlu merujuk ke dokumentasi terbaru
Apakah cocok untuk kreator animasi/manga?
- AniSora dioptimalkan untuk mewujudkan konsistensi karakter dan gerakan yang ekspresif, sehingga menjadi alat yang ideal bagi kreator, terutama di bidang animasi, PV, manga, dan VTuber
Kasus penggunaan utama
- Dapat digunakan secara luas untuk animasi pendek, video SNS, PV, animasi panel manga, VTuber, concept art, storyboard, dan lainnya
Kualitas dan durasi video
- AniSora unggul dalam pembuatan video pendek beresolusi tinggi (1080p)
- Umumnya paling cocok untuk klip pendek, dan untuk batasan yang lebih spesifik, informasi terbaru dapat dilihat di dokumentasi resmi
Cara mengontrol gaya dan gerakan
- Melalui input gambar atau prompt teks, pengguna dapat mengarahkan gaya visual dan gerakan yang diinginkan
- Berdasarkan data bidang animasi, model ini mendukung kontrol tingkat lanjut seperti kustomisasi gerakan, konsistensi karakter, dan penerapan gaya detail
- Cakupan operasional dapat berbeda tergantung versi atau antarmukanya
Kesimpulan
- AniSora adalah model AI pembuat video open-source berperforma tinggi yang dikhususkan untuk produksi video animasi, manga, dan VTuber
- Keunggulan utamanya adalah kemampuan reproduksi gaya yang berbeda, kemudahan penggunaan yang intuitif, dan pembuatan video berkualitas tinggi
- Dengan menitikberatkan pada budaya open-source komunitas dan dukungan bagi kreator, nilainya sangat tinggi untuk dimanfaatkan baik di bidang animasi Jepang maupun animasi Tiongkok
1 komentar
Komentar Hacker News
Rasanya beberapa hasilnya jelas menunjukkan jejak pelatihan dari webtoon, manga, mungkin juga pixiv, dan semacamnya. Buktinya mudah ditemukan pada bangunan CG atau berbagai artefak buatan lainnya. Pada akhirnya, kesimpulannya tetap bahwa model ini dilatih dengan materi berhak cipta. Karena seni bukanlah wilayah yang bisa dihasilkan secara sintetis seperti teks, seniman manusia akan tetap menempati posisi penting selamanya, atau hasilnya hanya akan terus memunculkan artefak aneh. Jadi saya jadi berpikir apakah ke depannya artis akan diturunkan derajatnya menjadi semacam tenaga kerja untuk pelatihan "AI". Tapi di sisi lain, kalau strukturnya adalah orang-orang menggambar hal yang mereka sukai lalu itu dipakai untuk melatih model, rasanya juga tidak terlalu buruk. Saya sendiri sangat pro-AI dalam hal hak cipta dan merek dagang, tetapi saya tetap penasaran apa yang akan terjadi pada banyak orang yang selama ini memberi kita hiburan. Apakah kualitasnya akan terus naik, atau justru gaya-gaya yang menantang akan hilang karena dianggap 'terlalu sulit untuk AI', dan semuanya jadi terasa mirip satu sama lain. Ini terasa berbeda dari PC atau mesin yang menggantikan manusia; rasanya seperti kita sudah sampai di semacam titik akhir.
Akhirnya kita mungkin benar-benar memasuki era ketika kita bisa membuat Haruhi season 3 yang selama ini kita inginkan. Rasanya sungguh menyenangkan hidup di masa seperti ini.
Saya mencobanya dengan ilustrasi promosi <i>Neon Genesis Evangelion</i>. Hasilnya lumayan, tetapi saat kepala berputar muncul artefak temporal pada animasi rambut. Ada juga halaman referensi seperti kumpulan contoh.
Menyampaikan ringkasan kutipan makalah: "Memperkenalkan metode pelatihan dengan panjang variabel, melatih segmen 2 detik hingga 8 detik. Dengan strategi ini, dimungkinkan menghasilkan video 720p berdurasi 2–8 detik." Saya ingin membandingkannya dengan FramePack. Menurut saya, untuk animasi 2D memang ada kelebihan karena hampir tidak ada batasan durasi frame.
Kalau tertarik dengan konten animasi AI, saya merekomendasikan ikut kompetisi AniGen.
Saya penasaran apakah model ini bisa menampilkan karakter yang sama secara konsisten di berbagai adegan dan sudut pandang. Menurut saya itu adalah keterbatasan utama dunia image generation sampai sekarang.
Dari contoh pertama saja sudah kelihatan banyak kesalahan. Bagian lengan pada kemejanya rusak, dan rambut yang bergerak kadang menghilang lalu muncul lagi. Pada akhirnya yang benar-benar bergerak kebanyakan cuma lengan dan awan.
Meski ganti akun dan input, setiap kali tetap muncul error aneh jadi tidak bisa berjalan dengan semestinya.
Saya penasaran dengan status hak cipta video yang dibuat dari layanan seperti ini. Saya ingin tahu apakah hasilnya mendapat perlindungan hak cipta. Posisi Kantor Hak Cipta AS saat ini adalah bahwa "hasil dari AI generatif hanya bisa dilindungi hak cipta jika penulis manusianya cukup menentukan (atau menyuntikkan) elemen kreatif." Jika tidak dilindungi, maka kalau seseorang membuat film dan sebagainya dengan layanan ini, ada risiko hasilnya langsung disalin atau dijiplak. Sebagai catatan, data apa yang dipakai untuk melatih tool ini saya sisihkan dari pembahasan.
Saya ingin melihat seberapa berbeda adegan pertarungan di <i>The Beginning After the End</i> jika diproses dengan tool ini. Saya sungguh penasaran dengan arah perkembangannya. Apakah orang akan menerima lebih banyak cacat visual dan artefak asalkan mereka mendapat season baru dari franchise yang mereka sukai, atau justru akan menolaknya seperti penggunaan model 3D yang terasa canggung?