Easy Stable Diffusion XL yang Bisa Dipakai Offline di Perangkat

(noiselith.com)

2 poin oleh GN⁺ 2023-12-03 | 1 komentar | Bagikan ke WhatsApp

Pengenalan aplikasi Noiselith

Alat pembuatan gambar offline: Noiselith memungkinkan Anda membuat gambar dengan bebas di perangkat tanpa cloud.
Perlindungan privasi: Semua proses pembuatan dilakukan secara lokal dan tidak ada informasi yang dikirim ke cloud.
Pembuatan tanpa batas: Menyediakan fitur pembuatan tanpa batas yang memungkinkan Anda membuat 100, 200, bahkan 1000 gambar per hari.
Kecepatan: Gambar dapat dibuat langsung di perangkat tanpa perlu menunggu sumber daya server.

Persyaratan sistem

Windows: Memerlukan Windows 10 atau 11, GPU NVIDIA RTX seri 20 atau yang lebih baru (VRAM 8GB atau lebih), RAM 16GB atau lebih, serta ruang penyimpanan 20GB atau lebih.
macOS: Memerlukan macOS 12.3 atau lebih baru, Apple Silicon, RAM 32GB atau lebih, serta ruang penyimpanan 20GB atau lebih.

Pengalaman pengguna

Instalasi mudah: Noiselith siap digunakan hanya dengan beberapa klik.
Penggunaan intuitif: Menyediakan antarmuka intuitif untuk mengubah ide menjadi visual tanpa perlu mengkhawatirkan detail teknis.
Manajemen model: Anda dapat dengan mudah mengunduh, menghapus, dan memperbarui model, serta tersedia galeri untuk menata gambar yang dihasilkan dengan rapi.

Roadmap pengembangan

Dukungan berbagai fitur: Direncanakan mendukung model SDXL, SDXL LoRA, manajemen riwayat, manajemen proyek, manajemen model, dan lainnya.
Komunitas dan skalabilitas: Mencakup fitur seperti komunitas pengguna, dukungan model SD 1.5 dan 2.1, basis data model, upscaler, smart prompt, dan lainnya.
Noiselith App Store: Berencana mengembangkan app store yang mencakup cloud GPU dan fitur kolaborasi jarak jauh.

Opini GN⁺

Poin terpenting dalam artikel ini adalah bahwa aplikasi Noiselith merupakan alat baru yang memungkinkan pengguna membuat gambar tanpa batas langsung di perangkat mereka tanpa bantuan cloud, sambil tetap menjaga privasi.
Aplikasi ini menarik karena mengurangi kerumitan instalasi dan penggunaan perangkat lunak, serta memungkinkan siapa pun mulai membuat gambar dengan mudah melalui antarmuka yang intuitif sehingga bisa lebih fokus pada pekerjaan kreatif.

1 komentar

GN⁺ 2023-12-03

Komentar Hacker News

Baru saja saya coba pasang, dan ini cukup keren. AI lokal adalah masa depan yang saya inginkan, dan saya juga sedang mengerjakan ke arah itu
Kelebihannya, ini berjalan cukup mandiri, penginstal model bawaannya dibuat dengan baik sehingga mudah mengunduh apa pun dari CivitAI (saya coba pasang https://civitai.com/models/183354/sdxl-ms-paint-portraits), kualitas generasi gambarnya tinggi dan stabil, serta menampilkan tahap-tahap di tengah proses generasi
Kekurangannya, ini mengunduh file model SDXL 6.94GB ke suatu tempat tanpa bertanya, bahkan tanpa menunjukkan lokasi atau ukurannya, meski belakangan saya tahu lokasinya bisa ditemukan dan diubah di pengaturan. Generasi pertama sangat lambat karena pemuatan model, dan meskipun waktu generasinya tidak dicatat, di M1 Max MacBook 64GB sepertinya butuh beberapa menit
Karena ada beberapa modul umpan balik, chat di kiri bawah sangat mengganggu dan rasanya tidak akan pernah saya pakai, dan di kanan atas juga ada permintaan umpan balik beta. Tidak seperti produk pesaing, ini bukan open source, ada 7 proses yang berjalan, dan saat idle memakai sekitar 1GB RAM. UX-nya bukan native macOS, tombol pintas dan menu bantuan yang biasanya diharapkan juga tidak ada, jadi terasa seperti aplikasi Electron. Secara keseluruhan 4/5 dan saya bersedia membukanya lagi
- Di macOS, Draw Things juga layak dicoba. SDXL berjalan cukup baik bahkan di perangkat macOS 8GiB
- Jika penasaran dengan tech stack-nya, ada di sini: https://noiselith.notion.site/License-61290d5ed7ab4c918402fd2510533a9b
  Jadi benar. Ini adalah aplikasi Electron dan memakai Svelte, headless-ui, tailwindcss, dan lain-lain
- Perlu ada prompt untuk menanyakan lokasi unduhan
- Kekurangan lainnya adalah ini hanya berjalan di Apple Silicon Mac
- Saya penasaran apakah memori idle 1GB itu per proses, atau total gabungan dari 7 proses tersebut
Opsi inferensi lokal sebenarnya sudah cukup banyak, dan yang penting adalah kebanyakan open source serta fiturnya juga lebih matang
Bahkan kalau ada yang membela dengan mengatakan, “Tapi Auto1111 atau Comfy UI-nya tidak ramah pengguna,” itu pun sebenarnya sudah ada solusinya: https://github.com/invoke-ai/InvokeAI
- Saya beralih ke InvokeAI dan rasanya tidak akan kembali ke webui a1111 standar. Saya suka tata letaknya secara keseluruhan, ada fitur workflow, dan semua atribut seperti prompt, model, LoRA yang dipakai saat membuat gambar bisa dipanggil ulang dengan mudah
  Juga bisa diatur dengan board, dan board, gambar, serta metadata semuanya disimpan dalam database SQLite yang dirancang dengan baik sehingga bisa diakses lewat DataGrip
- Ada juga cara memakai plugin diffusion AI untuk Krita: https://github.com/Acly/krita-ai-diffusion
- Slogan pemasaran “menjalankan Stable Diffusion secara lokal” terasa agak aneh. Soalnya, jujur saja, itu sudah merupakan hal yang mudah dilakukan
- Saya tidak yakin UI-nya ramah pengguna atau tidak, tetapi prosedur instalasi InvokeAI saja sudah menjadi hambatan bagi 99,9% orang di dunia. Ini bukan berarti Noiselith tidak bisa menjadi open source, tetapi jelas menawarkan sesuatu yang berbeda dari InvokeAI
Bagi yang belum pernah mencoba, saya sangat merekomendasikan Fooocus: https://github.com/lllyasviel/Fooocus
Pipeline Stable Diffusion lokal jumlahnya sangat banyak, tetapi yang ini memberikan kualitas output default yang luar biasa bagus hanya dengan prompt pendek. Benar-benar mengesankan
Alasannya karena ini mengintegrasikan banyak fitur penguat SDXL yang tidak diimplementasikan UI lain atau tidak diaktifkan secara default. Saya sudah memakainya sejak era Stable Diffusion 1.5 dan cukup mengikuti bidang ini, tetapi menyiapkan pipeline setara di ComfyUI, apalagi di diffusers, rasanya bakal menyiksa. Rasanya seperti “kompilasi hit dan default optimal” untuk SDXL
- Saya takut dengan pengaturan Python, padahal saya sendiri developer Python. Tapi begitu membuat virtual environment dan memasang dependensi, selesai. Ini benar-benar hebat, dan gambar yang dihasilkan langsung bagus
  Namun seperti yang disebut komentar lain, mengikat GTM di dalamnya memang tidak enak dilihat
  Contoh:
  https://imgz.org/i9oicVqo/
  https://imgz.org/i8Ur3WjW/
  https://imgz.org/i5j6r6TZ/
- Web UI versi instalasi self-hosted Fooocus tampaknya seperti menjual penggunanya ke Google Tag Manager
  Semoga industri kita secara keseluruhan sadar bahwa menjalankan pengawasan seperti ini adalah pilihan buruk dan berhenti saja
- Di Mac harus build sendiri, dan semua orang tahu betapa “menyenangkannya” membangun proyek Python
- Jika ingin hasil generasi lokal terbaik, Fooocus jauh lebih baik. Lvmin mencurahkan seluruh energinya untuk membuat gambar yang indah. Fakta bahwa lisensinya GPL juga menjadi nilai plus bagi saya
- Saya penasaran apakah ini tetap layak dipakai pada sistem CPU-only dengan RAM yang sangat besar
Menarik. Saya akan membandingkannya dengan https://diffusionbee.com yang sudah saya pakai untuk iseng selama beberapa bulan terakhir
- Saya sudah cek keduanya, dan Noiselith menghasilkan output yang jauh, jauh lebih baik
Mungkin bagus untuk pemasaran, tetapi agak aneh jika berjalan di perangkat dan offline dijadikan pembeda utama. Soalnya kemungkinan besar kebanyakan orang memang sudah memakai Stable Diffusion seperti itu
Rasanya akan lebih baik jika lebih fokus pada kemudahan instalasi dan penggunaan. Bagian itu justru masih belum terlalu baik. Bagi saya, kalau tidak ada ControlNet, upscaling, face detailer, dan kalau bisa regional prompting, saya tidak akan memakainya
Saya juga merasa akan bagus jika orang-orang yang ingin membuat generator SD sendiri mau berkontribusi ke salah satu proyek open source yang sudah ada
App store mungkin bisa jadi ide yang bagus, tetapi di dunia Auto1111 dan sekian banyak ekstensinya, sepertinya komunitas Stable Diffusion tidak akan meresponsnya dengan baik
- Intinya ada pada kalimat “bagus untuk pemasaran”. Itu harus terus didorong. Justru bagian yang terlihat aneh itulah yang menunjukkan target produk ini. Targetnya bukan orang yang sudah memakai SD, melainkan orang yang memakai layanan khusus online seperti Dall-E dan ingin dikonversi
- Sepertinya cukup banyak orang yang tidak memakai hal seperti A1111. Alasannya model instalasinya rumit: unduh ini, lalu unduh itu, lalu yang itu mengunduh hal lain, lalu setelah itu harus mengunduh file ini dan file itu secara manual
  Meski tidak menarik bagi pengguna lama, produk yang lebih sederhana tetap bisa sangat menarik bagi pengguna baru
- Saya melihat ada anehnya banyak wrapper cloud untuk Stable Diffusion. Jadi saya suka bahwa mereka secara jelas menonjolkan di perangkat/offline di bagian depan
  Saat pertama kali mencoba SD, terasa aneh karena banyak paket yang, alih-alih sekadar mengunduh beberapa file dan menjalankannya, malah memakai hal-hal seperti telepon ke rumah atau VM
- Saya sudah mencoba memakai SD di perangkat, tetapi saya tetap merasa membayar versi hosted itu sepadan. Soalnya jauh lebih cepat
Prompt penjualannya berbunyi “seorang wanita muda berambut pirang keriting dengan tatapan menggoda, duduk dengan kaki terbuka di depan latar dunia fantasi sambil mengenakan kemeja putih dan hot pants jeans”
Rasanya ini benar-benar tidak tepat
- Jika prompt-nya tidak agak seksual, kontroversial, atau menjengkelkan, kemungkinan besar ia akan langsung terkena paduan suara “tetap kalah dari midjourney/dall-e/imagen”. Kebebasan dari batasan adalah salah satu poin jual utamanya
- Saya sungguh penasaran berapa banyak orang di komunitas open source yang mencurahkan keringat dan darah untuk membuat proyek seperti ini. Pada akhirnya hasilnya cuma membuat para pria mengubah MacBook mereka menjadi Instagram pornobook
- Syukurlah bukan cuma saya yang merasa ini tidak pantas. Rasanya cukup seperti dog whistle
- Itu benar-benar bikin merinding
Setelah instalasi, untuk menjalankannya di mesin Windows saya harus memberi izin akses jaringan publik dan privat. Karena mereka bilang “offline”, ini terasa agak mengganjal
- Saya mengalami hal serupa
  Saat pertama dijalankan, ia mengunduh sekitar 30GB data. Saya tidak tahu apakah setelah itu ia benar-benar berjalan offline pada eksekusi berikutnya. Soalnya dalam kasus saya, setelah itu aplikasi terus crash dan tidak bisa dijalankan lagi
  Saat dihapus pun semua datanya dibiarkan tetap ada. Bukan cuma data pengguna, tetapi executable-nya sendiri, virtual environment Python, updater, semua model, semuanya tetap tertinggal. Penghapusannya pada dasarnya cuma seperti menghapus shortcut di Start Menu
- Saya penasaran apakah ia tetap bisa berjalan jika internet benar-benar diputus
  Jika untuk berjalan ia memerlukan koneksi internet aktif, maka memasarkan ini sebagai “offline” jelas sepenuhnya keliru
Tentu menyenangkan melihat semakin banyak klien lokal bermunculan. Seperti disebut di komentar lain, sebenarnya sudah ada beberapa yang sangat bagus. Saya pernah memakai automatic1111; cepat dan tidak butuh banyak tuning, tetapi tetap saja ada banyak knob dan opsi sehingga terasa sulit di awal. Fooocus sangat cepat, tetapi tentu saja kustomisasinya lebih sedikit
Lalu ada ComfyUI. Semacam cawan suci kompleksitas, tetapi justru karena kompleks itulah ia bisa melakukan sangat banyak hal. Ini aplikasi berbasis node, jadi Anda bisa membuat workflow kustom, dan setelah gambar dibuat, “node” itu bisa dikirim ke tempat lain untuk pascaproses seperti upscaling
Saya ingin melihat apakah Noiselith atau alat lain akan mendukung SDXLTurbo. Memang baru keluar beberapa hari, tetapi menurut saya ini benar-benar sesuatu yang mengubah permainan. Di GPU konsumen, ia bisa membuat gambar 512x512 dalam sekitar 0,5 detik. Kualitasnya memang tidak luar biasa, tetapi kemampuan untuk mengetik “seekor rubah di hutan”, langsung melihat hasilnya, lalu menambahkan “memakai topi” dan langsung menghasilkan lagi itu sangat berharga. Dulu saya harus menunggu 12 detik untuk setiap gambar. Kedengarannya sepele, tetapi bisa beriterasi secepat ini membuat pembuatan gambar lokal jadi jauh lebih menyenangkan
Saya memang belum mengujinya, tetapi karena Comfy memakai CoreML, saya penasaran apakah jika frontend yang lebih berguna mulai muncul, pekerjaan optimasi backend dan performa untuk platform seperti ini juga akan makin banyak
1~4it/s untuk gambar 512 terlalu mengecewakan, dan 2~3s/it pada 1024 juga terlalu lambat untuk standar sekarang. Bahkan ANE pun menyedihkan karena di MacBook Pro M3 tidak bisa menjalankan gambar SD 1024x1024

Easy Stable Diffusion XL yang Bisa Dipakai Offline di Perangkat

Pengenalan aplikasi Noiselith

Persyaratan sistem

Pengalaman pengguna

Roadmap pengembangan

Opini GN⁺

Bacaan terkait

1 komentar

Komentar Hacker News