- Pendekatan generatif baru untuk penyelesaian gambar yang dikembangkan oleh Google Research dan Cornell University
- RealFill bertujuan mengisi bagian gambar yang hilang dengan konten yang seharusnya ada agar menghasilkan gambar yang lebih autentik
- Model ini dipersonalisasi menggunakan beberapa gambar referensi yang tidak harus cocok persis dengan gambar target, dan dapat bervariasi dalam sudut pandang, kondisi pencahayaan, aperture kamera, atau gaya gambar
- RealFill jauh melampaui pendekatan sebelumnya pada benchmark penyelesaian gambar baru yang mencakup beragam skenario menantang
- Proses ini mencakup fine-tuning model difusi inpainting yang telah dipra-latih untuk gambar referensi dan target, sehingga model mempelajari konten, pencahayaan, dan gaya dari adegan pada gambar masukan
- Model yang telah di-fine-tune kemudian digunakan untuk mengisi area yang hilang pada gambar target melalui proses sampling difusi standar
- RealFill menghasilkan gambar berkualitas tinggi yang tetap setia pada adegan asli dan menarik secara visual bahkan ketika terdapat perbedaan besar antara referensi dan target
- Keterbatasan RealFill adalah proses fine-tuning berbasis gradien yang relatif lambat serta kesulitan memulihkan adegan 3D ketika perubahan sudut pandang antara gambar referensi dan target sangat besar
- RealFill juga mengalami kesulitan pada kasus-kasus menantang untuk model dasar yang telah dipra-latih seperti Stable Diffusion
1 komentar
Opini Hacker News