Pengumuman Stable Diffusion 3

xguru · 2024-02-23T09:16:02+09:00

Stable Diffusion 3 adalah model teks-ke-gambar terunggul, dengan peningkatan yang signifikan pada prompt multi-topik, kualitas gambar, dan kemampuan mengeja Meskipun belum tersedia secara luas, pendaftaran daftar tunggu untuk Early Preview telah dibuka Tahap preview ini, seperti model sebelumnya, penting untuk memperoleh wawasan guna meningkatkan performa dan keamanan Cakupan dan Teknologi Model Kumpulan model Stable Diffusion 3 mencakup rentang 800M hingga 8B parameter Pendekatan ini selaras dengan nilai inti kami untuk membuatnya dapat diakses semua orang, serta menyediakan berbagai pilihan skala dan kualitas yang paling cocok untuk memenuhi kebutuhan kreatif pengguna SD3 menggabungkan arsitektur Diffusion Transformer dengan Flow Matching Laporan teknis terperinci akan segera dipublikasikan Praktik AI yang Aman dan Bertanggung Jawab Kami menempatkan praktik AI yang aman dan bertanggung jawab sebagai prioritas Kami mengambil langkah-langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3, dan langkah ini berlanjut sejak tahap awal pelatihan hingga proses pengujian, evaluasi, dan deployment Menyiapkan preview awal, kami memperkenalkan berbagai fitur keamanan Dengan terus bekerja sama dengan peneliti, pakar, dan komunitas, kami berharap terjadinya inovasi lebih lanjut seiring makin banyaknya akses terhadap model ini Komitmen dan Pemberdayaan Kreativitas Komitmen kami agar AI generatif tetap terbuka, aman, dan mudah diakses oleh semua orang tetap kuat Melalui Stable Diffusion 3, kami akan menyediakan solusi yang adaptif agar individu, pengembang, dan perusahaan dapat menyalurkan kreativitasnya Jika Anda ingin menggunakan model gambar lain secara komersial sebelum peluncuran Stable Diffusion 3, Anda dapat mengunjungi halaman keanggotaan Stability AI atau mengakses API melalui platform pengembang

(stability.ai)

9 poin oleh xguru 2024-02-23 | 1 komentar | Bagikan ke WhatsApp

Stable Diffusion 3 adalah model teks-ke-gambar terunggul, dengan peningkatan yang signifikan pada prompt multi-topik, kualitas gambar, dan kemampuan mengeja
Meskipun belum tersedia secara luas, pendaftaran daftar tunggu untuk Early Preview telah dibuka
Tahap preview ini, seperti model sebelumnya, penting untuk memperoleh wawasan guna meningkatkan performa dan keamanan

Cakupan dan Teknologi Model

Kumpulan model Stable Diffusion 3 mencakup rentang 800M hingga 8B parameter
Pendekatan ini selaras dengan nilai inti kami untuk membuatnya dapat diakses semua orang, serta menyediakan berbagai pilihan skala dan kualitas yang paling cocok untuk memenuhi kebutuhan kreatif pengguna
SD3 menggabungkan arsitektur Diffusion Transformer dengan Flow Matching
Laporan teknis terperinci akan segera dipublikasikan

Praktik AI yang Aman dan Bertanggung Jawab

Kami menempatkan praktik AI yang aman dan bertanggung jawab sebagai prioritas
Kami mengambil langkah-langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3, dan langkah ini berlanjut sejak tahap awal pelatihan hingga proses pengujian, evaluasi, dan deployment
Menyiapkan preview awal, kami memperkenalkan berbagai fitur keamanan
Dengan terus bekerja sama dengan peneliti, pakar, dan komunitas, kami berharap terjadinya inovasi lebih lanjut seiring makin banyaknya akses terhadap model ini

Komitmen dan Pemberdayaan Kreativitas

Komitmen kami agar AI generatif tetap terbuka, aman, dan mudah diakses oleh semua orang tetap kuat
Melalui Stable Diffusion 3, kami akan menyediakan solusi yang adaptif agar individu, pengembang, dan perusahaan dapat menyalurkan kreativitasnya
Jika Anda ingin menggunakan model gambar lain secara komersial sebelum peluncuran Stable Diffusion 3, Anda dapat mengunjungi halaman keanggotaan Stability AI atau mengakses API melalui platform pengembang

1 komentar

xguru 2024-02-23

Komentar Hacker News

Menggunakan jenis transformer difusi baru yang menggabungkan flow matching dan peningkatan lain.
- Dengan peningkatan transformer, dapat lebih mudah diskalakan dan menerima masukan multimodal.
- Akan dirilis dengan peningkatan kualitas dan keamanan, dan diluncurkan bersama dengan seluruh ekosistem alat.
- Berbasis pendekatan baru yang memanfaatkan perangkat keras terbaru, dan tersedia di semua ukuran.
- Membuat fitur seperti video, 3D, dan sebagainya.
- Membutuhkan lebih banyak GPU.
- Detail teknisnya akan segera dipublikasikan.
- Jika Anda memiliki GPU yang cukup dan data yang bagus, dapat menghasilkan video mirip Sora.
- Tersedia dalam berbagai ukuran, dari 80 juta hingga 80 miliar parameter, sehingga bisa digunakan pada segala jenis GPU.
Mengingat insiden Gemini baru-baru ini, fokus berlebihan pada keamanan tampak membuat kesempatan pemasaran terlewat.
- Keamanan yang terlalu ketat membuat sebagian besar gambar terlihat buram, dan prompt yang berfungsi di versi sebelumnya menjadi buram di SDXL.
- Jika versi berikutnya sama seperti ini, saya akan berhenti memakai Stability API.
- Saya penasaran apakah ada layanan text-to-image lain yang menawarkan nilai dan kualitas sebanding dengan Stable Diffusion tanpa blur berlebihan.
Menarik untuk melihat apa arti "keamanan" dalam konteks sensor saat ini.
- Menjadi cukup sulit membuat gambar senjata untuk aset game menggunakan DallE.
Setengah isi pengumuman ini dipenuhi dengan kalimat "kami benar-benar bertanggung jawab dan aman".
Semua gambar demo adalah 'artwork'.
- Bagaimana dengan kemampuan model dalam menghasilkan foto, gambar teknik, dan media grafis lainnya?
Bagian teks/penulisan menunjukkan kemajuan besar.
Bagian "keamanan" ditulis ulang, tapi digantikan dengan sebuah pisau imajiner bernama 'Big Knife'.
- "Kami percaya pada penggunaan pisau yang aman dan bertanggung jawab. Ini berarti kami mengambil tindakan masuk akal untuk mencegah penyalahgunaan Big Knife oleh pelaku yang berniat jahat."