Easy Stable Diffusion XL yang Bisa Dipakai Offline di Perangkat
(noiselith.com)Pengenalan aplikasi Noiselith
- Alat pembuatan gambar offline: Noiselith memungkinkan Anda membuat gambar dengan bebas di perangkat tanpa cloud.
- Perlindungan privasi: Semua proses pembuatan dilakukan secara lokal dan tidak ada informasi yang dikirim ke cloud.
- Pembuatan tanpa batas: Menyediakan fitur pembuatan tanpa batas yang memungkinkan Anda membuat 100, 200, bahkan 1000 gambar per hari.
- Kecepatan: Gambar dapat dibuat langsung di perangkat tanpa perlu menunggu sumber daya server.
Persyaratan sistem
- Windows: Memerlukan Windows 10 atau 11, GPU NVIDIA RTX seri 20 atau yang lebih baru (VRAM 8GB atau lebih), RAM 16GB atau lebih, serta ruang penyimpanan 20GB atau lebih.
- macOS: Memerlukan macOS 12.3 atau lebih baru, Apple Silicon, RAM 32GB atau lebih, serta ruang penyimpanan 20GB atau lebih.
Pengalaman pengguna
- Instalasi mudah: Noiselith siap digunakan hanya dengan beberapa klik.
- Penggunaan intuitif: Menyediakan antarmuka intuitif untuk mengubah ide menjadi visual tanpa perlu mengkhawatirkan detail teknis.
- Manajemen model: Anda dapat dengan mudah mengunduh, menghapus, dan memperbarui model, serta tersedia galeri untuk menata gambar yang dihasilkan dengan rapi.
Roadmap pengembangan
- Dukungan berbagai fitur: Direncanakan mendukung model SDXL, SDXL LoRA, manajemen riwayat, manajemen proyek, manajemen model, dan lainnya.
- Komunitas dan skalabilitas: Mencakup fitur seperti komunitas pengguna, dukungan model SD 1.5 dan 2.1, basis data model, upscaler, smart prompt, dan lainnya.
- Noiselith App Store: Berencana mengembangkan app store yang mencakup cloud GPU dan fitur kolaborasi jarak jauh.
Opini GN⁺
- Poin terpenting dalam artikel ini adalah bahwa aplikasi Noiselith merupakan alat baru yang memungkinkan pengguna membuat gambar tanpa batas langsung di perangkat mereka tanpa bantuan cloud, sambil tetap menjaga privasi.
- Aplikasi ini menarik karena mengurangi kerumitan instalasi dan penggunaan perangkat lunak, serta memungkinkan siapa pun mulai membuat gambar dengan mudah melalui antarmuka yang intuitif sehingga bisa lebih fokus pada pekerjaan kreatif.
1 komentar
Komentar Hacker News
Baru saja saya coba pasang, dan ini cukup keren. AI lokal adalah masa depan yang saya inginkan, dan saya juga sedang mengerjakan ke arah itu
Kelebihannya, ini berjalan cukup mandiri, penginstal model bawaannya dibuat dengan baik sehingga mudah mengunduh apa pun dari CivitAI (saya coba pasang https://civitai.com/models/183354/sdxl-ms-paint-portraits), kualitas generasi gambarnya tinggi dan stabil, serta menampilkan tahap-tahap di tengah proses generasi
Kekurangannya, ini mengunduh file model SDXL 6.94GB ke suatu tempat tanpa bertanya, bahkan tanpa menunjukkan lokasi atau ukurannya, meski belakangan saya tahu lokasinya bisa ditemukan dan diubah di pengaturan. Generasi pertama sangat lambat karena pemuatan model, dan meskipun waktu generasinya tidak dicatat, di M1 Max MacBook 64GB sepertinya butuh beberapa menit
Karena ada beberapa modul umpan balik, chat di kiri bawah sangat mengganggu dan rasanya tidak akan pernah saya pakai, dan di kanan atas juga ada permintaan umpan balik beta. Tidak seperti produk pesaing, ini bukan open source, ada 7 proses yang berjalan, dan saat idle memakai sekitar 1GB RAM. UX-nya bukan native macOS, tombol pintas dan menu bantuan yang biasanya diharapkan juga tidak ada, jadi terasa seperti aplikasi Electron. Secara keseluruhan 4/5 dan saya bersedia membukanya lagi
Jadi benar. Ini adalah aplikasi Electron dan memakai Svelte, headless-ui, tailwindcss, dan lain-lain
Opsi inferensi lokal sebenarnya sudah cukup banyak, dan yang penting adalah kebanyakan open source serta fiturnya juga lebih matang
Bahkan kalau ada yang membela dengan mengatakan, “Tapi Auto1111 atau Comfy UI-nya tidak ramah pengguna,” itu pun sebenarnya sudah ada solusinya: https://github.com/invoke-ai/InvokeAI
Juga bisa diatur dengan board, dan board, gambar, serta metadata semuanya disimpan dalam database SQLite yang dirancang dengan baik sehingga bisa diakses lewat DataGrip
Bagi yang belum pernah mencoba, saya sangat merekomendasikan Fooocus: https://github.com/lllyasviel/Fooocus
Pipeline Stable Diffusion lokal jumlahnya sangat banyak, tetapi yang ini memberikan kualitas output default yang luar biasa bagus hanya dengan prompt pendek. Benar-benar mengesankan
Alasannya karena ini mengintegrasikan banyak fitur penguat SDXL yang tidak diimplementasikan UI lain atau tidak diaktifkan secara default. Saya sudah memakainya sejak era Stable Diffusion 1.5 dan cukup mengikuti bidang ini, tetapi menyiapkan pipeline setara di ComfyUI, apalagi di diffusers, rasanya bakal menyiksa. Rasanya seperti “kompilasi hit dan default optimal” untuk SDXL
Namun seperti yang disebut komentar lain, mengikat GTM di dalamnya memang tidak enak dilihat
Contoh:
https://imgz.org/i9oicVqo/
https://imgz.org/i8Ur3WjW/
https://imgz.org/i5j6r6TZ/
Semoga industri kita secara keseluruhan sadar bahwa menjalankan pengawasan seperti ini adalah pilihan buruk dan berhenti saja
Menarik. Saya akan membandingkannya dengan https://diffusionbee.com yang sudah saya pakai untuk iseng selama beberapa bulan terakhir
Mungkin bagus untuk pemasaran, tetapi agak aneh jika berjalan di perangkat dan offline dijadikan pembeda utama. Soalnya kemungkinan besar kebanyakan orang memang sudah memakai Stable Diffusion seperti itu
Rasanya akan lebih baik jika lebih fokus pada kemudahan instalasi dan penggunaan. Bagian itu justru masih belum terlalu baik. Bagi saya, kalau tidak ada ControlNet, upscaling, face detailer, dan kalau bisa regional prompting, saya tidak akan memakainya
Saya juga merasa akan bagus jika orang-orang yang ingin membuat generator SD sendiri mau berkontribusi ke salah satu proyek open source yang sudah ada
App store mungkin bisa jadi ide yang bagus, tetapi di dunia Auto1111 dan sekian banyak ekstensinya, sepertinya komunitas Stable Diffusion tidak akan meresponsnya dengan baik
Meski tidak menarik bagi pengguna lama, produk yang lebih sederhana tetap bisa sangat menarik bagi pengguna baru
Saat pertama kali mencoba SD, terasa aneh karena banyak paket yang, alih-alih sekadar mengunduh beberapa file dan menjalankannya, malah memakai hal-hal seperti telepon ke rumah atau VM
Prompt penjualannya berbunyi “seorang wanita muda berambut pirang keriting dengan tatapan menggoda, duduk dengan kaki terbuka di depan latar dunia fantasi sambil mengenakan kemeja putih dan hot pants jeans”
Rasanya ini benar-benar tidak tepat
Setelah instalasi, untuk menjalankannya di mesin Windows saya harus memberi izin akses jaringan publik dan privat. Karena mereka bilang “offline”, ini terasa agak mengganjal
Saat pertama dijalankan, ia mengunduh sekitar 30GB data. Saya tidak tahu apakah setelah itu ia benar-benar berjalan offline pada eksekusi berikutnya. Soalnya dalam kasus saya, setelah itu aplikasi terus crash dan tidak bisa dijalankan lagi
Saat dihapus pun semua datanya dibiarkan tetap ada. Bukan cuma data pengguna, tetapi executable-nya sendiri, virtual environment Python, updater, semua model, semuanya tetap tertinggal. Penghapusannya pada dasarnya cuma seperti menghapus shortcut di Start Menu
Jika untuk berjalan ia memerlukan koneksi internet aktif, maka memasarkan ini sebagai “offline” jelas sepenuhnya keliru
Tentu menyenangkan melihat semakin banyak klien lokal bermunculan. Seperti disebut di komentar lain, sebenarnya sudah ada beberapa yang sangat bagus. Saya pernah memakai automatic1111; cepat dan tidak butuh banyak tuning, tetapi tetap saja ada banyak knob dan opsi sehingga terasa sulit di awal. Fooocus sangat cepat, tetapi tentu saja kustomisasinya lebih sedikit
Lalu ada ComfyUI. Semacam cawan suci kompleksitas, tetapi justru karena kompleks itulah ia bisa melakukan sangat banyak hal. Ini aplikasi berbasis node, jadi Anda bisa membuat workflow kustom, dan setelah gambar dibuat, “node” itu bisa dikirim ke tempat lain untuk pascaproses seperti upscaling
Saya ingin melihat apakah Noiselith atau alat lain akan mendukung SDXLTurbo. Memang baru keluar beberapa hari, tetapi menurut saya ini benar-benar sesuatu yang mengubah permainan. Di GPU konsumen, ia bisa membuat gambar 512x512 dalam sekitar 0,5 detik. Kualitasnya memang tidak luar biasa, tetapi kemampuan untuk mengetik “seekor rubah di hutan”, langsung melihat hasilnya, lalu menambahkan “memakai topi” dan langsung menghasilkan lagi itu sangat berharga. Dulu saya harus menunggu 12 detik untuk setiap gambar. Kedengarannya sepele, tetapi bisa beriterasi secepat ini membuat pembuatan gambar lokal jadi jauh lebih menyenangkan
Saya memang belum mengujinya, tetapi karena Comfy memakai CoreML, saya penasaran apakah jika frontend yang lebih berguna mulai muncul, pekerjaan optimasi backend dan performa untuk platform seperti ini juga akan makin banyak
1~4it/s untuk gambar 512 terlalu mengecewakan, dan 2~3s/it pada 1024 juga terlalu lambat untuk standar sekarang. Bahkan ANE pun menyedihkan karena di MacBook Pro M3 tidak bisa menjalankan gambar SD 1024x1024