10 poin oleh xguru 2024-10-24 | Belum ada komentar. | Bagikan ke WhatsApp
  • Mencakup beberapa versi model yang dapat dijalankan di perangkat keras konsumen dan dapat dikustomisasi secara fleksibel, serta gratis digunakan untuk sebagian besar kasus penggunaan
  • Model Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo dapat diunduh dari Hugging Face, sementara kode inferensinya dapat diunduh dari GitHub
  • Model yang dirilis
    • Stable Diffusion 3.5 Large: model dasar dengan 8 miliar parameter dan yang paling kuat di keluarga Stable Diffusion. Ideal untuk kasus penggunaan profesional pada resolusi 1 megapiksel
    • Stable Diffusion 3.5 Large Turbo: versi hasil distilasi dari Stable Diffusion 3.5 Large, yang menghasilkan gambar berkualitas tinggi hanya dalam 4 langkah dengan kepatuhan prompt yang sangat baik. Jauh lebih cepat daripada Stable Diffusion 3.5 Large
    • Stable Diffusion 3.5 Medium (dijadwalkan rilis pada 29 Oktober): memiliki 2,5 miliar parameter, dan dirancang agar dapat langsung berjalan di perangkat keras konsumen dengan arsitektur MMDiT-X dan metode pelatihan yang ditingkatkan. Menyeimbangkan kualitas dan kemudahan kustomisasi. Mampu menghasilkan gambar pada resolusi 0,25~2 megapiksel

Proses pengembangan model

  • Saat mengembangkan model, prioritas diberikan pada kemungkinan kustomisasi agar menyediakan fondasi yang fleksibel
  • Untuk itu, Query-Key Normalization diintegrasikan ke dalam blok transformer guna menstabilkan proses pelatihan model serta menyederhanakan fine-tuning dan pengembangan tambahan
  • Beberapa trade-off diperlukan untuk mendukung fleksibilitas downstream
  • Saat seed diubah untuk prompt yang sama, variabilitas output dapat meningkat. Ini memang disengaja agar model dasar mempertahankan basis pengetahuan yang lebih luas dan beragam gaya
  • Namun, prompt yang kurang spesifik dapat meningkatkan ketidakpastian output, dan tingkat estetikanya dapat bervariasi
  • Untuk model Medium, arsitektur dan protokol pelatihan disesuaikan beberapa kali guna meningkatkan kualitas, konsistensi, dan kemampuan menghasilkan pada banyak resolusi

Kelebihan Stable Diffusion 3.5

  • Kemudahan kustomisasi: model dapat dengan mudah di-fine-tune sesuai kebutuhan kreatif tertentu, atau digunakan untuk membangun aplikasi berbasis workflow yang disesuaikan
  • Kinerja yang efisien: khususnya model Stable Diffusion 3.5 Medium dan Stable Diffusion 3.5 Large Turbo dioptimalkan untuk berjalan pada perangkat keras konsumen standar tanpa kebutuhan yang berat
  • Output yang beragam: dapat menghasilkan gambar yang merepresentasikan orang-orang dari seluruh dunia dengan beragam warna kulit dan karakteristik tanpa prompting yang luas
  • Stable Diffusion 3.5 Large memimpin pasar dalam kepatuhan prompt dan sebanding dengan model yang jauh lebih besar dalam kualitas gambar
  • Stable Diffusion 3.5 Large Turbo menawarkan waktu inferensi tercepat di kelas ukurannya, sambil tetap sangat kompetitif dalam kualitas gambar dan kepatuhan prompt
  • Stable Diffusion 3.5 Medium melampaui model menengah lain, dengan menyeimbangkan kepatuhan prompt dan kualitas gambar untuk memberikan performa yang efisien dan berkualitas tinggi

Ringkasan Stability AI Community License

  • Gratis untuk penggunaan nonkomersial: individu dan organisasi dapat menggunakannya secara gratis untuk tujuan nonkomersial, termasuk riset ilmiah
  • Gratis untuk penggunaan komersial bagi yang berpendapatan tahunan di bawah 1 juta dolar AS: startup, UKM, dan kreator dapat menggunakannya secara gratis untuk tujuan komersial jika pendapatan tahunan mereka di bawah 1 juta dolar AS
  • Kepemilikan atas hasil keluaran: tetap dapat memiliki media yang dihasilkan tanpa implikasi pelisensian yang membatasi
  • Organisasi dengan pendapatan tahunan di atas 1 juta dolar AS dapat menghubungi Stability AI untuk menanyakan lisensi enterprise

Cara mengakses model

  • Bobot model saat ini tersedia di Hugging Face untuk self-hosting
  • Model juga dapat diakses melalui platform seperti Stability AI API, Replicate, ComfyUI, dan DeepInfra

Komitmen Stability AI terhadap keamanan

  • Stability AI meyakini praktik AI yang aman dan bertanggung jawab, serta mengambil langkah-langkah yang disengaja untuk memastikan integritas sejak tahap awal pengembangan
  • Mereka juga mengambil langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3.5 oleh pelaku jahat

Rencana ke depan

  • Stable Diffusion 3.5 Medium dijadwalkan dirilis secara publik pada 29 Oktober
  • Setelah itu, ControlNets yang menyediakan fungsi kontrol lanjutan untuk berbagai kasus penggunaan profesional juga dijadwalkan rilis

Belum ada komentar.

Belum ada komentar.