Stable Diffusion 3.5 Dirilis

xguru · 2024-10-24T11:26:01+09:00

Mencakup beberapa versi model yang dapat dijalankan di perangkat keras konsumen dan dapat dikustomisasi secara fleksibel, serta gratis digunakan untuk sebagian besar kasus penggunaan Model Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo dapat diunduh dari Hugging Face, sementara kode inferensinya dapat diunduh dari GitHub Model yang dirilis Stable Diffusion 3.5 Large: model dasar dengan 8 miliar parameter dan yang paling kuat di keluarga Stable Diffusion. Ideal untuk kasus penggunaan profesional pada resolusi 1 megapiksel Stable Diffusion 3.5 Large Turbo: versi hasil distilasi dari Stable Diffusion 3.5 Large, yang menghasilkan gambar berkualitas tinggi hanya dalam 4 langkah dengan kepatuhan prompt yang sangat baik. Jauh lebih cepat daripada Stable Diffusion 3.5 Large Stable Diffusion 3.5 Medium (dijadwalkan rilis pada 29 Oktober): memiliki 2,5 miliar parameter, dan dirancang agar dapat langsung berjalan di perangkat keras konsumen dengan arsitektur MMDiT-X dan metode pelatihan yang ditingkatkan. Menyeimbangkan kualitas dan kemudahan kustomisasi. Mampu menghasilkan gambar pada resolusi 0,25~2 megapiksel Proses pengembangan model Saat mengembangkan model, prioritas diberikan pada kemungkinan kustomisasi agar menyediakan fondasi yang fleksibel Untuk itu, Query-Key Normalization diintegrasikan ke dalam blok transformer guna menstabilkan proses pelatihan model serta menyederhanakan fine-tuning dan pengembangan tambahan Beberapa trade-off diperlukan untuk mendukung fleksibilitas downstream Saat seed diubah untuk prompt yang sama, variabilitas output dapat meningkat. Ini memang disengaja agar model dasar mempertahankan basis pengetahuan yang lebih luas dan beragam gaya Namun, prompt yang kurang spesifik dapat meningkatkan ketidakpastian output, dan tingkat estetikanya dapat bervariasi Untuk model Medium, arsitektur dan protokol pelatihan disesuaikan beberapa kali guna meningkatkan kualitas, konsistensi, dan kemampuan menghasilkan pada banyak resolusi Kelebihan Stable Diffusion 3.5 Kemudahan kustomisasi: model dapat dengan mudah di-fine-tune sesuai kebutuhan kreatif tertentu, atau digunakan untuk membangun aplikasi berbasis workflow yang disesuaikan Kinerja yang efisien: khususnya model Stable Diffusion 3.5 Medium dan Stable Diffusion 3.5 Large Turbo dioptimalkan untuk berjalan pada perangkat keras konsumen standar tanpa kebutuhan yang berat Output yang beragam: dapat menghasilkan gambar yang merepresentasikan orang-orang dari seluruh dunia dengan beragam warna kulit dan karakteristik tanpa prompting yang luas Stable Diffusion 3.5 Large memimpin pasar dalam kepatuhan prompt dan sebanding dengan model yang jauh lebih besar dalam kualitas gambar Stable Diffusion 3.5 Large Turbo menawarkan waktu inferensi tercepat di kelas ukurannya, sambil tetap sangat kompetitif dalam kualitas gambar dan kepatuhan prompt Stable Diffusion 3.5 Medium melampaui model menengah lain, dengan menyeimbangkan kepatuhan prompt dan kualitas gambar untuk memberikan performa yang efisien dan berkualitas tinggi Ringkasan Stability AI Community License Gratis untuk penggunaan nonkomersial: individu dan organisasi dapat menggunakannya secara gratis untuk tujuan nonkomersial, termasuk riset ilmiah Gratis untuk penggunaan komersial bagi yang berpendapatan tahunan di bawah 1 juta dolar AS: startup, UKM, dan kreator dapat menggunakannya secara gratis untuk tujuan komersial jika pendapatan tahunan mereka di bawah 1 juta dolar AS Kepemilikan atas hasil keluaran: tetap dapat memiliki media yang dihasilkan tanpa implikasi pelisensian yang membatasi Organisasi dengan pendapatan tahunan di atas 1 juta dolar AS dapat menghubungi Stability AI untuk menanyakan lisensi enterprise Cara mengakses model Bobot model saat ini tersedia di Hugging Face untuk self-hosting Model juga dapat diakses melalui platform seperti Stability AI API, Replicate, ComfyUI, dan DeepInfra Komitmen Stability AI terhadap keamanan Stability AI meyakini praktik AI yang aman dan bertanggung jawab, serta mengambil langkah-langkah yang disengaja untuk memastikan integritas sejak tahap awal pengembangan Mereka juga mengambil langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3.5 oleh pelaku jahat Rencana ke depan Stable Diffusion 3.5 Medium dijadwalkan dirilis secara publik pada 29 Oktober Setelah itu, ControlNets yang menyediakan fungsi kontrol lanjutan untuk berbagai kasus penggunaan profesional juga dijadwalkan rilis

(stability.ai)

10 poin oleh xguru 2024-10-24 | Belum ada komentar. | Bagikan ke WhatsApp

Mencakup beberapa versi model yang dapat dijalankan di perangkat keras konsumen dan dapat dikustomisasi secara fleksibel, serta gratis digunakan untuk sebagian besar kasus penggunaan
Model Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo dapat diunduh dari Hugging Face, sementara kode inferensinya dapat diunduh dari GitHub
Model yang dirilis
- Stable Diffusion 3.5 Large: model dasar dengan 8 miliar parameter dan yang paling kuat di keluarga Stable Diffusion. Ideal untuk kasus penggunaan profesional pada resolusi 1 megapiksel
- Stable Diffusion 3.5 Large Turbo: versi hasil distilasi dari Stable Diffusion 3.5 Large, yang menghasilkan gambar berkualitas tinggi hanya dalam 4 langkah dengan kepatuhan prompt yang sangat baik. Jauh lebih cepat daripada Stable Diffusion 3.5 Large
- Stable Diffusion 3.5 Medium (dijadwalkan rilis pada 29 Oktober): memiliki 2,5 miliar parameter, dan dirancang agar dapat langsung berjalan di perangkat keras konsumen dengan arsitektur MMDiT-X dan metode pelatihan yang ditingkatkan. Menyeimbangkan kualitas dan kemudahan kustomisasi. Mampu menghasilkan gambar pada resolusi 0,25~2 megapiksel

Proses pengembangan model

Saat mengembangkan model, prioritas diberikan pada kemungkinan kustomisasi agar menyediakan fondasi yang fleksibel
Untuk itu, Query-Key Normalization diintegrasikan ke dalam blok transformer guna menstabilkan proses pelatihan model serta menyederhanakan fine-tuning dan pengembangan tambahan
Beberapa trade-off diperlukan untuk mendukung fleksibilitas downstream
Saat seed diubah untuk prompt yang sama, variabilitas output dapat meningkat. Ini memang disengaja agar model dasar mempertahankan basis pengetahuan yang lebih luas dan beragam gaya
Namun, prompt yang kurang spesifik dapat meningkatkan ketidakpastian output, dan tingkat estetikanya dapat bervariasi
Untuk model Medium, arsitektur dan protokol pelatihan disesuaikan beberapa kali guna meningkatkan kualitas, konsistensi, dan kemampuan menghasilkan pada banyak resolusi

Kelebihan Stable Diffusion 3.5

Kemudahan kustomisasi: model dapat dengan mudah di-fine-tune sesuai kebutuhan kreatif tertentu, atau digunakan untuk membangun aplikasi berbasis workflow yang disesuaikan
Kinerja yang efisien: khususnya model Stable Diffusion 3.5 Medium dan Stable Diffusion 3.5 Large Turbo dioptimalkan untuk berjalan pada perangkat keras konsumen standar tanpa kebutuhan yang berat
Output yang beragam: dapat menghasilkan gambar yang merepresentasikan orang-orang dari seluruh dunia dengan beragam warna kulit dan karakteristik tanpa prompting yang luas
Stable Diffusion 3.5 Large memimpin pasar dalam kepatuhan prompt dan sebanding dengan model yang jauh lebih besar dalam kualitas gambar
Stable Diffusion 3.5 Large Turbo menawarkan waktu inferensi tercepat di kelas ukurannya, sambil tetap sangat kompetitif dalam kualitas gambar dan kepatuhan prompt
Stable Diffusion 3.5 Medium melampaui model menengah lain, dengan menyeimbangkan kepatuhan prompt dan kualitas gambar untuk memberikan performa yang efisien dan berkualitas tinggi

Ringkasan Stability AI Community License

Gratis untuk penggunaan nonkomersial: individu dan organisasi dapat menggunakannya secara gratis untuk tujuan nonkomersial, termasuk riset ilmiah
Gratis untuk penggunaan komersial bagi yang berpendapatan tahunan di bawah 1 juta dolar AS: startup, UKM, dan kreator dapat menggunakannya secara gratis untuk tujuan komersial jika pendapatan tahunan mereka di bawah 1 juta dolar AS
Kepemilikan atas hasil keluaran: tetap dapat memiliki media yang dihasilkan tanpa implikasi pelisensian yang membatasi
Organisasi dengan pendapatan tahunan di atas 1 juta dolar AS dapat menghubungi Stability AI untuk menanyakan lisensi enterprise

Cara mengakses model

Bobot model saat ini tersedia di Hugging Face untuk self-hosting
Model juga dapat diakses melalui platform seperti Stability AI API, Replicate, ComfyUI, dan DeepInfra

Komitmen Stability AI terhadap keamanan

Stability AI meyakini praktik AI yang aman dan bertanggung jawab, serta mengambil langkah-langkah yang disengaja untuk memastikan integritas sejak tahap awal pengembangan
Mereka juga mengambil langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3.5 oleh pelaku jahat

Rencana ke depan

Stable Diffusion 3.5 Medium dijadwalkan dirilis secara publik pada 29 Oktober
Setelah itu, ControlNets yang menyediakan fungsi kontrol lanjutan untuk berbagai kasus penggunaan profesional juga dijadwalkan rilis