Imagen - model difusi text-to-image dari Google

xguru · 2022-05-25T09:32:41+09:00

Model AI yang memahami bahasa pada tingkat mendalam untuk menghasilkan gambar yang realistis Dalam evaluasi yang melibatkan manusia, menghasilkan gambar yang lebih disukai dibanding DALL-E 2 milik OpenAI → dari sisi kualitas dan keselarasan gambar-teks Hanya makalah riset dan contoh gambar yang dipublikasikan → versi demo yang dapat digunakan dari luar diputuskan untuk tidak dirilis karena masalah etika dan lain-lain

(imagen.research.google)

10 poin oleh xguru 2022-05-25 | 2 komentar | Bagikan ke WhatsApp

Model AI yang memahami bahasa pada tingkat mendalam untuk menghasilkan gambar yang realistis
Dalam evaluasi yang melibatkan manusia, menghasilkan gambar yang lebih disukai dibanding DALL-E 2 milik OpenAI
→ dari sisi kualitas dan keselarasan gambar-teks
Hanya makalah riset dan contoh gambar yang dipublikasikan
→ versi demo yang dapat digunakan dari luar diputuskan untuk tidak dirilis karena masalah etika dan lain-lain

2 komentar

kunggom 2022-05-25

Kemarin di toko buku saya melihat buku Alice in Wonderland yang menyisipkan still cut animasi Disney sebagai ilustrasi, dan saya penasaran hasil seperti apa yang akan keluar jika setiap adegan dari Alice in Wonderland dimasukkan ke model semacam itu.

xguru 2022-05-25

Pengungkapan DALL·E 2
Bagaimana cara kerja DALL-E 2?

Imagen - model difusi text-to-image dari Google

Bacaan terkait

2 komentar