9 poin oleh xguru 2024-02-23 | 1 komentar | Bagikan ke WhatsApp
  • Stable Diffusion 3 adalah model teks-ke-gambar terunggul, dengan peningkatan yang signifikan pada prompt multi-topik, kualitas gambar, dan kemampuan mengeja
  • Meskipun belum tersedia secara luas, pendaftaran daftar tunggu untuk Early Preview telah dibuka
  • Tahap preview ini, seperti model sebelumnya, penting untuk memperoleh wawasan guna meningkatkan performa dan keamanan

Cakupan dan Teknologi Model

  • Kumpulan model Stable Diffusion 3 mencakup rentang 800M hingga 8B parameter
  • Pendekatan ini selaras dengan nilai inti kami untuk membuatnya dapat diakses semua orang, serta menyediakan berbagai pilihan skala dan kualitas yang paling cocok untuk memenuhi kebutuhan kreatif pengguna
  • SD3 menggabungkan arsitektur Diffusion Transformer dengan Flow Matching
  • Laporan teknis terperinci akan segera dipublikasikan

Praktik AI yang Aman dan Bertanggung Jawab

  • Kami menempatkan praktik AI yang aman dan bertanggung jawab sebagai prioritas
  • Kami mengambil langkah-langkah yang wajar untuk mencegah penyalahgunaan Stable Diffusion 3, dan langkah ini berlanjut sejak tahap awal pelatihan hingga proses pengujian, evaluasi, dan deployment
  • Menyiapkan preview awal, kami memperkenalkan berbagai fitur keamanan
  • Dengan terus bekerja sama dengan peneliti, pakar, dan komunitas, kami berharap terjadinya inovasi lebih lanjut seiring makin banyaknya akses terhadap model ini

Komitmen dan Pemberdayaan Kreativitas

  • Komitmen kami agar AI generatif tetap terbuka, aman, dan mudah diakses oleh semua orang tetap kuat
  • Melalui Stable Diffusion 3, kami akan menyediakan solusi yang adaptif agar individu, pengembang, dan perusahaan dapat menyalurkan kreativitasnya
  • Jika Anda ingin menggunakan model gambar lain secara komersial sebelum peluncuran Stable Diffusion 3, Anda dapat mengunjungi halaman keanggotaan Stability AI atau mengakses API melalui platform pengembang

1 komentar

 
xguru 2024-02-23

Komentar Hacker News

  • Menggunakan jenis transformer difusi baru yang menggabungkan flow matching dan peningkatan lain.

    • Dengan peningkatan transformer, dapat lebih mudah diskalakan dan menerima masukan multimodal.
    • Akan dirilis dengan peningkatan kualitas dan keamanan, dan diluncurkan bersama dengan seluruh ekosistem alat.
    • Berbasis pendekatan baru yang memanfaatkan perangkat keras terbaru, dan tersedia di semua ukuran.
    • Membuat fitur seperti video, 3D, dan sebagainya.
    • Membutuhkan lebih banyak GPU.
    • Detail teknisnya akan segera dipublikasikan.
    • Jika Anda memiliki GPU yang cukup dan data yang bagus, dapat menghasilkan video mirip Sora.
    • Tersedia dalam berbagai ukuran, dari 80 juta hingga 80 miliar parameter, sehingga bisa digunakan pada segala jenis GPU.
  • Mengingat insiden Gemini baru-baru ini, fokus berlebihan pada keamanan tampak membuat kesempatan pemasaran terlewat.

    • Keamanan yang terlalu ketat membuat sebagian besar gambar terlihat buram, dan prompt yang berfungsi di versi sebelumnya menjadi buram di SDXL.
    • Jika versi berikutnya sama seperti ini, saya akan berhenti memakai Stability API.
    • Saya penasaran apakah ada layanan text-to-image lain yang menawarkan nilai dan kualitas sebanding dengan Stable Diffusion tanpa blur berlebihan.
  • Menarik untuk melihat apa arti "keamanan" dalam konteks sensor saat ini.

    • Menjadi cukup sulit membuat gambar senjata untuk aset game menggunakan DallE.
  • Setengah isi pengumuman ini dipenuhi dengan kalimat "kami benar-benar bertanggung jawab dan aman".

  • Semua gambar demo adalah 'artwork'.

    • Bagaimana dengan kemampuan model dalam menghasilkan foto, gambar teknik, dan media grafis lainnya?
  • Bagian teks/penulisan menunjukkan kemajuan besar.

  • Bagian "keamanan" ditulis ulang, tapi digantikan dengan sebuah pisau imajiner bernama 'Big Knife'.

    • "Kami percaya pada penggunaan pisau yang aman dan bertanggung jawab. Ini berarti kami mengambil tindakan masuk akal untuk mencegah penyalahgunaan Big Knife oleh pelaku yang berniat jahat."