Imagen - model difusi text-to-image dari Google
(imagen.research.google)- Model AI yang memahami bahasa pada tingkat mendalam untuk menghasilkan gambar yang realistis
- Dalam evaluasi yang melibatkan manusia, menghasilkan gambar yang lebih disukai dibanding DALL-E 2 milik OpenAI
→ dari sisi kualitas dan keselarasan gambar-teks - Hanya makalah riset dan contoh gambar yang dipublikasikan
→ versi demo yang dapat digunakan dari luar diputuskan untuk tidak dirilis karena masalah etika dan lain-lain
2 komentar
Kemarin di toko buku saya melihat buku Alice in Wonderland yang menyisipkan still cut animasi Disney sebagai ilustrasi, dan saya penasaran hasil seperti apa yang akan keluar jika setiap adegan dari Alice in Wonderland dimasukkan ke model semacam itu.
Pengungkapan DALL·E 2
Bagaimana cara kerja DALL-E 2?