28 poin oleh xguru 2023-06-09 | 9 komentar | Bagikan ke WhatsApp
  • Seorang pengguna Reddit bernama nhciao membuat kode QR bergaya anime yang benar-benar berfungsi dengan menggunakan ControlNet + LoRA
  • Hal ini dimungkinkan berkat fitur Error Correction yang memang dimiliki kode QR
  • Dapat diterapkan dalam berbagai gaya seperti pola tradisional Tiongkok, ukiyo-e, animasi 2D, lukisan tinta, cat air, tiga dimensi, abstrak, PCB, dan lainnya
  • Detail selengkapnya dapat dilihat di tulisan asli yang ditulis dalam bahasa Mandarin

9 komentar

 
yinn27 2023-06-10

Luar biasa idenya…

 
qkreoaksn 2023-06-09

Astaga.....

 
popup 2023-06-09

Ternyata saat saya coba, kode QR-nya bisa dikenali. Menarik juga.

 
kuroneko 2023-06-09

Saya bisa memahami bahwa secara teori itu mungkin, tetapi tetap saja saya benar-benar sulit percaya bahwa itu benar-benar bisa dipindai. Sangat menakjubkan.

 
xguru 2023-06-09

Tulisan blog berbahasa Tionghoa: https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw

 
kuroneko 2023-06-09

Saat saya memasukkan tulisan aslinya ke alat peringkas, hasilnya jadi seperti ini.

  • Artikel ini membahas model ControlNet baru yang dapat menghasilkan gambar kode QR yang bisa dipindai. ControlNet dapat menyandikan informasi tersembunyi di dalam gambar yang bagi mata manusia tampak biasa saja.
  • Penulis dan rekan-rekannya sebelumnya pernah membuat generator kode QR terparameterisasi, tetapi tidak terus memperbaruinya. Ide yang sekarang muncul setelah Stable Diffusion dirilis.
  • Percobaan awal ControlNet adalah melatih pola tradisional Tiongkok. Penulis menyebut bahwa pelatihan dilakukan menggunakan dokumentasi AIGC All in One dan HuggingFace JAX/Diffusers.
  • Untuk melatih ControlNet dibutuhkan data dalam jumlah besar dan daya komputasi yang tinggi. Dalam riset ini digunakan hingga 300.000 gambar dan waktu GPU setara 600 A100. Penulis melatih versi 100.000 gambar dengan learning rate yang besar.
  • Setelah pelatihan, penulis menguji berbagai kombinasi Checkpoint + LoRA + QR Code ControlNet untuk menghasilkan kode QR yang bisa dipindai dalam beragam gaya seperti pola tradisional Tiongkok, ukiyo-e, 2D, tinta, perspektif, abstrak, dan gaya PCB.
  • Kode QR yang dihasilkan mencakup gaya pola tradisional Tiongkok, ukiyo-e, animasi, ilustrasi, tinta, cat air, 3D, dan abstrak.
  • Proyek ini bergantung pada kolaborasi dengan beberapa rekan serta sumber daya GPU dari laboratorium. Server Google TPU juga membantu mempercepat pelatihan.
  • Penulis berencana ke depannya akan merilis model dan dokumen teknis melalui akun resmi WeChat dan situs web.
  • Artikel ini menyebut bahwa model generatif AI berkembang sangat cepat, dan mengungkapkan keinginan untuk kembali kuliah.
  • Penulis berterima kasih kepada Google dan HuggingFace yang menyediakan server TPU, sambil mengatakan bahwa mereka "bisa bersenang-senang".
 
lunamoth 2023-06-09

Boleh tahu Anda menggunakan layanan apa untuk peringkasnya?

 
kuroneko 2023-06-11

Saya menggunakan Universal Summarizer dari Kagi.

 
lunamoth 2023-06-11

Terima kasih sudah memberi tahu.