14 poin oleh xguru 2022-11-24 | 1 komentar | Bagikan ke WhatsApp
  • SD v1 telah mengubah lanskap model AI open source
  • SD v2 melatih model text-to-image dengan OpenCLIP, text encoder baru, sehingga kualitas gambar meningkat jauh dibanding v1
  • Dapat menghasilkan gambar 512x512 dan 768x768
  • Dilatih menggunakan subset estetis dari dataset LAION-5B (serta mengecualikan konten dewasa dengan filter NSFW)
  • Menyertakan model Upscaler Diffusion untuk meningkatkan resolusi gambar hingga 4x
    • Artinya, gambar 128x128 dapat di-upscale menjadi 512x512
    • Dengan kata lain, SD v2 kini dapat menghasilkan gambar dengan resolusi 2048x2048 atau lebih tinggi
  • Model Depth-to-Image Diffusion: depth2img
    • Memperluas fitur image-to-image yang ada ke kemungkinan baru
    • Menginferensikan depth dari gambar masukan, lalu menggunakan teks dan informasi depth untuk menghasilkan gambar baru
    • Artinya, kini dimungkinkan untuk menghasilkan bagian tertentu secara berbeda sesuai depth gambar
  • Model Inpainting Diffusion ditingkatkan
  • Seperti SD v1, telah dioptimalkan agar dapat dijalankan bahkan di lingkungan single GPU

1 komentar

 
laeyoung 2022-11-25

Kami juga menyediakan SD v1 dengan upscaler terpasang (dibuat dalam 512 x 512 lalu jika pengguna mau, di-upscale 4x untuk lebar dan tinggi), dan menurut kami kombinasi itu lebih cepat dan lebih baik daripada membuat ukuran besar dengan SD v1.