- SDXL Turbo menerapkan teknik distilasi baru untuk mencapai performa mutakhir
- Mengurangi langkah untuk pembuatan gambar dari 50 langkah menjadi hanya 1 langkah, sambil menghasilkan gambar single-step dengan kualitas yang belum pernah ada sebelumnya
- Bobot model dan kode dapat diunduh di Hugging Face di bawah lisensi riset nonkomersial
- Demo beta fitur pembuatan teks-ke-gambar real-time SDXL Turbo sedang ditampilkan di Clipdrop, platform pengeditan gambar milik Stability AI
Keunggulan Adversarial Diffusion Distillation
- SDXL Turbo didasarkan pada teknik distilasi baru bernama Adversarial Diffusion Distillation (ADD)
- Melalui ADD, model ini memiliki keunggulan yang mirip dengan GAN (Generative Adversarial Networks) sekaligus dapat menghasilkan gambar dalam satu langkah
- Menghindari artefak atau efek blur yang sering terlihat pada metode distilasi lain
Perbandingan performa dengan model difusi lain
- Untuk memilih SDXL Turbo, berbagai varian model dibandingkan (StyleGAN-T++, OpenMUSE, IF-XL, SDXL, LCM-XL)
- Hasil keluaran yang dibuat dari prompt yang sama ditampilkan secara acak kepada evaluator manusia, lalu mereka diminta memilih output yang paling mengikuti maksud prompt
- Pengujian tambahan untuk kualitas gambar juga dilakukan dengan metode yang sama
- SDXL Turbo dalam satu langkah melampaui konfigurasi 4 langkah LCM-XL, dan dalam 4 langkah melampaui konfigurasi 50 langkah SDXL
- Hasil ini menunjukkan bahwa SDXL Turbo melampaui model multi-step mutakhir dengan kebutuhan komputasi yang jauh lebih rendah tanpa mengorbankan kualitas gambar
Mencoba SDXL Turbo melalui Clipdrop
- Untuk menguji kemampuan model baru ini, tersedia demo beta pembuatan gambar real-time SDXL Turbo di Clipdrop, platform pengeditan gambar milik Stability AI
- Kompatibel dengan sebagian besar browser dan saat ini dapat dicoba secara gratis
Penggunaan komersial
- Jika ingin menggunakan model ini untuk produk atau tujuan komersial, perlu menghubungi pihak terkait
1 komentar
Sangat cepat ya