- Mencakup beberapa versi model yang dapat dijalankan di perangkat keras konsumen dan dapat dikustomisasi secara fleksibel, serta gratis digunakan untuk sebagian besar kasus penggunaan
- Model Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo dapat diunduh dari Hugging Face, sementara kode inferensinya dapat diunduh dari GitHub
- Model yang dirilis
- Stable Diffusion 3.5 Large: model dasar dengan 8 miliar parameter dan yang paling kuat di keluarga Stable Diffusion. Ideal untuk kasus penggunaan profesional pada resolusi 1 megapiksel
- Stable Diffusion 3.5 Large Turbo: versi hasil distilasi dari Stable Diffusion 3.5 Large, yang menghasilkan gambar berkualitas tinggi hanya dalam 4 langkah dengan kepatuhan prompt yang sangat baik. Jauh lebih cepat daripada Stable Diffusion 3.5 Large
- Stable Diffusion 3.5 Medium (dijadwalkan rilis pada 29 Oktober): memiliki 2,5 miliar parameter, dan dirancang agar dapat langsung berjalan di perangkat keras konsumen dengan arsitektur MMDiT-X dan metode pelatihan yang ditingkatkan. Menyeimbangkan kualitas dan kemudahan kustomisasi. Mampu menghasilkan gambar pada resolusi 0,25~2 megapiksel
Proses pengembangan model
- Saat mengembangkan model, prioritas diberikan pada kemungkinan kustomisasi agar menyediakan fondasi yang fleksibel
- Untuk itu, Query-Key Normalization diintegrasikan ke dalam blok transformer guna menstabilkan proses pelatihan model serta menyederhanakan fine-tuning dan pengembangan tambahan
- Beberapa trade-off diperlukan untuk mendukung fleksibilitas downstream
- Saat seed diubah untuk prompt yang sama, variabilitas output dapat meningkat. Ini memang disengaja agar model dasar mempertahankan basis pengetahuan yang lebih luas dan beragam gaya
- Namun, prompt yang kurang spesifik dapat meningkatkan ketidakpastian output, dan tingkat estetikanya dapat bervariasi
- Untuk model Medium, arsitektur dan protokol pelatihan disesuaikan beberapa kali guna meningkatkan kualitas, konsistensi, dan kemampuan menghasilkan pada banyak resolusi
Kelebihan Stable Diffusion 3.5
- Kemudahan kustomisasi: model dapat dengan mudah di-fine-tune sesuai kebutuhan kreatif tertentu, atau digunakan untuk membangun aplikasi berbasis workflow yang disesuaikan
- Kinerja yang efisien: khususnya model Stable Diffusion 3.5 Medium dan Stable Diffusion 3.5 Large Turbo dioptimalkan untuk berjalan pada perangkat keras konsumen standar tanpa kebutuhan yang berat
- Output yang beragam: dapat menghasilkan gambar yang merepresentasikan orang-orang dari seluruh dunia dengan beragam warna kulit dan karakteristik tanpa prompting yang luas
- Stable Diffusion 3.5 Large memimpin pasar dalam kepatuhan prompt dan sebanding dengan model yang jauh lebih besar dalam kualitas gambar
- Stable Diffusion 3.5 Large Turbo menawarkan waktu inferensi tercepat di kelas ukurannya, sambil tetap sangat kompetitif dalam kualitas gambar dan kepatuhan prompt
- Stable Diffusion 3.5 Medium melampaui model menengah lain, dengan menyeimbangkan kepatuhan prompt dan kualitas gambar untuk memberikan performa yang efisien dan berkualitas tinggi
Ringkasan Stability AI Community License
- Gratis untuk penggunaan nonkomersial: individu dan organisasi dapat menggunakannya secara gratis untuk tujuan nonkomersial, termasuk riset ilmiah
- Gratis untuk penggunaan komersial bagi yang berpendapatan tahunan di bawah 1 juta dolar AS: startup, UKM, dan kreator dapat menggunakannya secara gratis untuk tujuan komersial jika pendapatan tahunan mereka di bawah 1 juta dolar AS
- Kepemilikan atas hasil keluaran: tetap dapat memiliki media yang dihasilkan tanpa implikasi pelisensian yang membatasi
- Organisasi dengan pendapatan tahunan di atas 1 juta dolar AS dapat menghubungi Stability AI untuk menanyakan lisensi enterprise
Cara mengakses model
- Bobot model saat ini tersedia di Hugging Face untuk self-hosting
- Model juga dapat diakses melalui platform seperti Stability AI API, Replicate, ComfyUI, dan DeepInfra
Komitmen Stability AI terhadap keamanan
- Stability AI meyakini praktik AI yang aman dan bertanggung jawab, serta mengambil langkah-langkah yang disengaja untuk memastikan integritas sejak tahap awal pengembangan
- Mereka juga mengambil langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3.5 oleh pelaku jahat
Rencana ke depan
- Stable Diffusion 3.5 Medium dijadwalkan dirilis secara publik pada 29 Oktober
- Setelah itu, ControlNets yang menyediakan fungsi kontrol lanjutan untuk berbagai kasus penggunaan profesional juga dijadwalkan rilis
Belum ada komentar.