- SD v1 telah mengubah lanskap model AI open source
- SD v2 melatih model text-to-image dengan OpenCLIP, text encoder baru, sehingga kualitas gambar meningkat jauh dibanding v1
- Dapat menghasilkan gambar 512x512 dan 768x768
- Dilatih menggunakan subset estetis dari dataset LAION-5B (serta mengecualikan konten dewasa dengan filter NSFW)
- Menyertakan model Upscaler Diffusion untuk meningkatkan resolusi gambar hingga 4x
- Artinya, gambar 128x128 dapat di-upscale menjadi 512x512
- Dengan kata lain, SD v2 kini dapat menghasilkan gambar dengan resolusi 2048x2048 atau lebih tinggi
- Model Depth-to-Image Diffusion:
depth2img
- Memperluas fitur image-to-image yang ada ke kemungkinan baru
- Menginferensikan depth dari gambar masukan, lalu menggunakan teks dan informasi depth untuk menghasilkan gambar baru
- Artinya, kini dimungkinkan untuk menghasilkan bagian tertentu secara berbeda sesuai depth gambar
- Model Inpainting Diffusion ditingkatkan
- Seperti SD v1, telah dioptimalkan agar dapat dijalankan bahkan di lingkungan single GPU
1 komentar
Kami juga menyediakan SD v1 dengan upscaler terpasang (dibuat dalam 512 x 512 lalu jika pengguna mau, di-upscale 4x untuk lebar dan tinggi), dan menurut kami kombinasi itu lebih cepat dan lebih baik daripada membuat ukuran besar dengan SD v1.