3 poin oleh GN⁺ 2024-10-15 | 1 komentar | Bagikan ke WhatsApp
  • FLUX berjalan lebih cepat di Replicate, dan kode yang dioptimalkan dirilis sebagai open source sehingga siapa pun dapat memeriksa dan meningkatkannya
  • Rahasia peningkatan kecepatan
    • Model FLUX dikelola bekerja sama dengan Black Forest Labs, dan dua pekerjaan optimasi utama dilakukan
      • Optimasi model: meningkatkan performa dengan menggunakan torch.compile dan kernel atensi CuDNN
      • Menambahkan HTTP API sinkron baru untuk meningkatkan kecepatan model gambar secara signifikan
    • Kuantisasi pada flux-fp8-api sedikit mengubah output, tetapi tidak banyak memengaruhi kualitas
    • Metode optimasi dipublikasikan secara transparan, dan pengguna dapat menonaktifkan optimasi tersebut
  • Kecepatan open source
    • Model open source pada dasarnya sering kali lambat, dan para penyedia model kerap mengoptimalkannya lalu menyediakannya sebagai API proprietari
    • Semua peningkatan pada FLUX dirilis sebagai open source agar komunitas dapat berkolaborasi mengembangkan model yang lebih cepat
  • Pemanfaatan FLUX
    • Selain menjalankan FLUX di Replicate, ada berbagai kemungkinan penggunaan lain
      • Dapat melakukan fine-tuning FLUX dengan data pengguna
      • Dapat memodifikasi kode dan menerapkan versi kustom
      • Dapat mencoba model di playground baru dan membandingkan output

Ringkasan GN⁺

  • FLUX memberikan kesempatan bagi siapa pun untuk memanfaatkan model yang telah dioptimalkan melalui peningkatan performa di Replicate dan perilisannya sebagai open source
  • Upaya untuk mengatasi masalah kecepatan pada open source memungkinkan pengembangan model yang lebih cepat melalui kolaborasi dengan komunitas
  • Beragam kemungkinan pemanfaatan FLUX memberi pengguna peluang untuk menyediakan solusi yang disesuaikan
  • Proyek lain dengan fungsi serupa mencakup TensorFlow dan PyTorch

1 komentar

 
GN⁺ 2024-10-15
Komentar Hacker News
  • Ada pendapat bahwa model text-to-image terasa tidak efisien, dan akan lebih baik jika prosesnya dipecah menjadi beberapa tahap. Setiap tahap bisa dilatih secara independen sehingga memungkinkan modularisasi, dan penyuntingan gambar juga akan menjadi lebih mudah

    • Sebagai contoh, dijelaskan bahwa akan lebih mudah menghasilkan gambar seperti "objek x berada di samping objek y, dan di atasnya ada teks foo"
    • Disebutkan bahwa model rendering akhir bisa ada terpisah dari prompt, sehingga gaya seni atau tingkat realisme dapat disesuaikan
  • Ditekankan bahwa perangkat lunak nonkomersial bukan open source, dan dijelaskan bahwa jika penulis asli berhenti melakukan pemeliharaan, orang lain tidak bisa melanjutkannya atau harus bekerja secara gratis

    • Open source menyediakan lisensi yang memungkinkan siapa pun melanjutkan pengembangan ketika pembuat aslinya berhenti mengerjakannya
    • Hanya FLUX.1 [schnell] yang open source (Apache2), sedangkan FLUX.1 [dev] bersifat nonkomersial
  • Disarankan untuk memasukkan prompt ke URL Pollinations agar bisa menggunakan FLUX.schnell dengan mudah

    • Disebutkan bahwa kecepatan FLUX sangat mengagumkan, dan hanya dengan tiga GPU L40S bisa menghasilkan 8000 gambar setiap 30 menit
  • Mengatakan suka menggunakan FLUX untuk membuat gambar berlatar putih yang akan dipakai di Substack

    • Dijelaskan bahwa ini bagus karena dapat menyampaikan sesuatu secara visual bersama teks
  • Disebutkan bahwa FLUX adalah yang terdepan di antara sistem generasi yang di-host secara lokal dalam hal kepatuhan terhadap prompt, tetapi kemunculan depth of field dangkal yang selalu ada terasa mengganggu

  • Mengatakan telah membatalkan langganan Midjourney, dan sedang mempertimbangkan Replicate dan Ideogram

  • Penasaran dengan data pelatihan FLUX 1.1, dan menjelaskan bahwa gambar yang dihasilkan terlihat seperti foto pribadi

    • Mengajukan pertanyaan apakah data pelatihannya diambil dari postingan Facebook publik, Snapchat, Vkontakte, dan sebagainya
  • Berpikir bahwa model FLUX 1.1 pro kemungkinan tidak menggunakan data pelatihan yang sangat berbeda dari model open sebelumnya

  • Menyebut halaman perbandingan FLUX, dan menjelaskan bahwa versi cepatnya menampilkan gambar yang sepenuhnya berbeda dari model asli

  • Menyebut kontroversi open source terkait model Meta, dan menjelaskan bahwa dalam kasus FLUX, hanya FLUX schnell yang open source

    • Disebutkan bahwa model Llama dari Meta memiliki lisensi yang lebih longgar dan lebih mudah disesuaikan daripada FLUX schnell
  • Berpendapat bahwa komunitas open source seharusnya mendukung proyek seperti OpenFLUX

  • Mempertanyakan mengapa masalah tangan yang masih tampak aneh belum juga teratasi