- Stable Diffusion yang diimplementasikan dengan C/C++ murni, beserta artikel tentang model machine learning
- Implementasi berbasis ggml, dengan cara kerja yang mirip dengan llama.cpp
- Mendukung kuantisasi float 16-bit dan 32-bit, serta integer 4-bit, 5-bit, dan 8-bit
- Implementasi yang efisien dalam penggunaan memori dan dioptimalkan untuk inferensi CPU; membutuhkan sekitar 2,3GB saat menghasilkan gambar 512x512 menggunakan txt2img
- Mendukung AVX, AVX2, dan AVX512 untuk arsitektur x86
- Mencakup mode txt2img dan img2img asli, termasuk tokenizer bergaya stable-diffusion-webui
- Metode sampling yang digunakan adalah Euler A
- Implementasi yang kompatibel dengan platform Linux, Mac OS, dan Windows
- Peningkatan yang direncanakan ke depan mencakup lebih banyak metode sampling, dukungan GPU, inferensi yang lebih cepat, pengurangan penggunaan memori, dukungan LoRA, dukungan k-quants, serta reproduksibilitas lintas platform
- Artikel ini menyediakan petunjuk rinci tentang cara memperoleh kode, mengonversi bobot, membangun, dan menjalankan implementasi
- Implementasi ini mendukung berbagai format model keluaran, termasuk floating point 16-bit, floating point 32-bit, dan beragam kuantisasi integer
- Artikel ini juga menyediakan contoh penggunaan implementasi untuk mode txt2img dan img2img
- Kebutuhan memori dan disk berbeda tergantung presisi yang digunakan, tetapi untuk gambar 512x512, kebutuhan memori berada di kisaran sekitar 2,0G hingga 2,8G
- Implementasi ini didasarkan pada berbagai referensi seperti ggml, stable-diffusion, stable-diffusion-webui, dan k-diffusion
Belum ada komentar.