- Model text-to-image paling canggih
- Dibandingkan versi sebelumnya, hasilnya lebih hidup, dengan warna yang lebih akurat serta kontras, bayangan, dan pencahayaan yang lebih baik
- 3,5 miliar parameter
- Mampu menghasilkan gambar beresolusi 1 megapiksel dalam hitungan detik
- Dapat dikustomisasi dan bisa di-fine-tune untuk konsep serta gaya
- Pembuatan teks juga ditingkatkan sehingga generasi teks tingkat lanjut dan keterbacaannya menjadi lebih baik
- Mendukung inpainting, outpainting, dan prompt image-to-image
2 komentar
Saya mencoba membuat penjelasan detail otomatis dari postingan pengumuman resmi dengan GPT-4.
Pengumuman SDXL 1.0 (ANNOUNCING SDXL 1.0)
Pengenalan
Tim Stability AI dengan bangga merilis SDXL 1.0 sebagai model terbuka, tahap evolusi berikutnya dari model generasi teks-ke-gambar. Menyusul peluncuran terbatas SDXL 0.9 yang hanya ditujukan untuk riset, versi penuh SDXL telah ditingkatkan menjadi model generasi gambar terbuka terbaik di dunia.
Ringkasan
SDXL 1.0 adalah model gambar utama Stability AI dan model terbuka terbaik untuk pembuatan gambar. Kami telah membandingkannya dengan berbagai model lain, dan hasilnya menunjukkan bahwa orang-orang lebih menyukai gambar yang dihasilkan oleh SDXL 1.0 dibanding model terbuka lainnya. Temuan ini berasal dari data preferensi selama beberapa minggu yang dikumpulkan dari generasi model eksperimental di Discord kami, serta dari pengujian eksternal.
SDXL menghasilkan gambar berkualitas tinggi di hampir semua gaya seni, dan merupakan model terbuka terbaik untuk fotorealisme. Gambar yang unik dapat diprompt tanpa “nuansa” tertentu yang dipaksakan oleh model, sehingga menjamin kebebasan gaya sepenuhnya. SDXL 1.0 secara khusus disetel dengan baik untuk warna yang tajam dan akurat, serta memiliki kontras, pencahayaan, dan bayangan yang lebih baik daripada pendahulunya. Selain itu, SDXL dapat menghasilkan konsep yang sulit dirender oleh model gambar, misalnya tangan, teks, atau komposisi yang tersusun secara spasial (contoh: seorang perempuan mengejar anjing di latar belakang).
SDXL hanya memerlukan beberapa kata untuk menghasilkan gambar yang kompleks, detail, dan memuaskan secara estetika. Pengguna tidak lagi perlu memakai istilah penguat seperti “mahakarya” untuk mendapatkan gambar berkualitas tinggi. Selain itu, SDXL dapat memahami perbedaan antara konsep seperti “The Red Square” (tempat terkenal) dan “red square” (bentuk).
SDXL 1.0 memiliki jumlah parameter terbesar di antara model gambar akses terbuka, dan dibangun di atas arsitektur baru yang inovatif yang terdiri dari model dasar berbasis 3.5B parameter dan refiner 6.6B parameter. Model lengkapnya terdiri dari pipeline mixture-of-experts untuk latent diffusion: pada tahap pertama, model dasar menghasilkan laten (berisik), lalu ini diproses lebih lanjut oleh model penyempurna yang terspesialisasi untuk tahap denoising akhir. Sebagai catatan, model dasar juga dapat digunakan sebagai modul mandiri. Arsitektur dua tahap ini memberikan pendekatan yang kokoh untuk pembuatan gambar dan menghasilkan hasil yang lebih baik lagi.
Referensi
Stability AI Blog: Blog Stability AI menyediakan informasi terperinci tentang riset dan pengumuman terbaru perusahaan ini. Melalui blog ini, Anda bisa memperoleh informasi tambahan tentang model terbaru seperti SDXL 1.0.
https://stability.ai/blog
Stable Diffusion: Situs web ini menyediakan informasi terperinci tentang teknologi Stable Diffusion milik Stability AI. Teknologi ini merupakan komponen inti dari SDXL 1.0, dan melalui situs ini Anda bisa memperoleh pemahaman yang lebih mendalam tentang teknologi tersebut.
https://stability.ai/stable-diffusion
Discord Community: Komunitas Discord ini adalah tempat para peneliti dan pengguna Stability AI berkumpul untuk berbagi dan mendiskusikan pekerjaan mereka. Melalui komunitas ini, Anda bisa mendengar pengalaman orang lain yang menggunakan model seperti SDXL 1.0.
https://discord.gg/stablediffusion
Ada sedikit penjelasan yang lebih rinci di pengumuman resmi StabilityAI, jadi saya tinggalkan tautannya. :)
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement