8 poin oleh GN⁺ 2025-06-29 | 1 komentar | Bagikan ke WhatsApp
  • FLUX.1 Kontext [dev] adalah versi open weight yang dirilis gratis dari model pengeditan gambar generatif yang sebelumnya bersifat eksklusif
  • Dengan 12B parameter, model ini dapat berjalan pada hardware kelas konsumen dan didistribusikan gratis untuk riset serta penggunaan nonkomersial
  • Menyediakan performa pengeditan gambar berkualitas tinggi setara komersial seperti pengeditan lokal/global yang detail, menjaga konsistensi karakter, dan revisi berulang, serta dapat langsung terintegrasi dengan framework populer seperti ComfyUI, Hugging Face Diffusers, dan TensorRT
  • Dalam evaluasi performa, model ini menunjukkan hasil yang lebih baik dibanding model terbuka maupun tertutup yang sudah ada (misalnya Google's Gemini-Flash Image)
  • Varian TensorRT yang dioptimalkan untuk arsitektur NVIDIA Blackwell (BF16, FP8, FP4) juga disediakan, menghadirkan peningkatan besar dalam kecepatan dan efisiensi pada hardware terbaru
  • Melalui lisensi komersial dan portal swalayan, model ini juga mudah diintegrasikan dan dimanfaatkan dalam bisnis

Pengenalan dan Pentingnya

  • FLUX.1 Kontext [dev] adalah model pengeditan gambar generatif terbaru yang dirilis oleh Black Forest Labs
  • Selama ini, model unggulan untuk pembuatan/pengeditan gambar sebagian besar tersedia secara eksklusif, tetapi kini beralih menjadi open weight sehingga siapa pun dapat menggunakannya untuk riset dan tujuan nonkomersial
  • Model ini terdiri dari 12B parameter, menawarkan performa unggul sekaligus efisien sehingga dapat berjalan pada hardware konsumen umum

Rilis dan Aksesibilitas

  • FLUX.1 Kontext [dev] dirilis di bawah lisensi nonkomersial FLUX.1, dan tersedia gratis bagi pengguna untuk riset dan tujuan nonkomersial
  • Bobot model dapat diunduh dengan mudah dari HuggingFace dan kompatibel dengan framework AI utama seperti ComfyUI, HuggingFace Diffusers, dan TensorRT
  • Mitra seperti FAL, Replicate, Runware, DataCrunch, dan TogetherAI menyediakan endpoint API serta kode yang dapat langsung digunakan di lingkungan cloud maupun lokal

Standar Baru di Bidang Pengeditan Gambar

  • FLUX.1 Kontext [dev] dikhususkan untuk tugas pengeditan gambar
    • Unggul dalam mempertahankan karakter pada pengeditan berulang serta di berbagai adegan dan lingkungan
    • Mendukung pengeditan lokal dan keseluruhan yang presisi
  • Black Forest Labs menargetkan penyediaan alat terbuka yang sebanding dengan model proprietary
  • Dalam benchmark skala besar (seperti KontextBench), model ini membuktikan performa yang unggul dibanding model terbuka yang sudah ada seperti ByteDance Bagel dan HiDream-E1-Full, serta model komersial seperti Google Gemini-Flash Image
  • Evaluasi independen oleh lembaga eksternal seperti Artificial Analysis juga mengonfirmasi hasil yang konsisten

Optimasi Hardware dan Berbagai Pilihan

  • Bekerja sama dengan NVIDIA, tersedia bobot TensorRT yang dioptimalkan untuk arsitektur Blackwell terbaru (versi BF16, FP8, FP4 yang dioptimalkan untuk energi dan kecepatan)
  • Pengembang dapat dengan mudah memilih keseimbangan kecepatan, efisiensi, dan kualitas sesuai kebutuhan

Lisensi dan Portal untuk Pemanfaatan Komersial

  • Black Forest Labs membuka portal lisensi swalayan dengan syarat yang transparan, menyederhanakan akses komersial/nonkomersial untuk semua model open weight
  • Perusahaan dapat dengan mudah membeli lisensi melalui portal tersebut, lalu dengan cepat mengintegrasikan model keluarga FLUX.1 ke dalam layanan bisnis

Pembaruan Lisensi

  • Definisi tujuan nonkomersial diperjelas untuk memberikan batasan cakupan yang diizinkan dan pembatasan secara lebih spesifik
  • Ditambahkan klausul filter konten untuk mencegah pembuatan konten ilegal/melanggar hak, sekaligus melengkapi klausul penafian terkait
  • Pengelolaan asal konten dan riwayat pembuatan diatur agar mematuhi peraturan perundang-undangan terkait
  • Ditambahkan contoh yang jelas serta batasan untuk kasus penggunaan yang tidak diperbolehkan

Referensi dan Dukungan

1 komentar

 
GN⁺ 2025-06-29
Komentar Hacker News
  • Hal yang sangat keren adalah BFL merilis bobot model, dan di tengah kenyataan bahwa keberlanjutan finansial open source itu sulit, menurut saya pendekatan memberi akses gratis ke kalangan akademik dan mengenakan biaya lisensi yang wajar kepada startup adalah cara yang memungkinkan BFL dan perusahaan lain terus merilis model open-weight

    • Jika BFL harus membayar biaya izin penggunaan secara eksplisit di muka untuk semua gambar dan konten berbasis video yang digunakannya, saya rasa cara seperti itu tidak akan berkelanjutan secara finansial
  • Hal menarik dari merilis open weight adalah kita bisa menambahkan kemampuan baru (tugas) ke model editing seperti ini

    • Tampaknya model ini bisa melakukan generalisasi dengan baik bahkan dengan sedikit sampel (sekitar 30), dan itu dibagikan di blog
      • Kontext kali ini adalah versi yang ditunggu semua orang, dan terasa jauh lebih praktis
      • Ini adalah contoh pertama dari generasi baru model pembuatan gambar yang bisa dilatih, sesuatu yang tidak dimungkinkan pada model besar yang sudah ada seperti Gemini, GPT, dan MJ
  • Saya berharap model Dev yang sudah didistilasi tetap mempertahankan performa yang cukup baik dibandingkan model Pro/Max yang lebih besar

    • Saya berharap model ini pada akhirnya bisa sepenuhnya menggantikan teknik inpainting lama seperti Stable Diffusion dalam banyak hal
    • Eksperimen perbandingan sebelum dan sesudah editing gambar dengan Kontext bisa dilihat di sini
  • Saya sempat mencoba sistem ini langsung di hackathon yang diadakan minggu lalu di San Francisco, dan kesannya cukup mengesankan

    • Saya penasaran proyek seperti apa yang dibuat orang-orang di hackathon itu
  • Rasanya niat dari lisensi ini adalah menjadi semacam penyaringan awal yang membatasi siapa saja yang bisa mengaksesnya

    • Secara formal memang terbuka, tetapi dalam praktiknya cakupannya jadi sempit, dan pengaturan seperti ini punya efek membakukan siapa yang bisa mencoba
    • Memang ada keuntungan dalam mencegah penyalahgunaan, tetapi penggunaan yang berguna juga bisa ikut terpotong, dan pada akhirnya ini cenderung secara halus mengubah tolok ukur eksperimen baru
  • Lisensi penggunaan nonkomersial yang baru diterapkan punya aturan yang cukup rumit, dan bisa merujuk ke teks lisensi lengkap

    • Jika lisensi ini ditafsirkan secara benar, maka bahkan jika tujuannya bukan membuat turunan melainkan sekadar menghasilkan output, model ini tetap tidak bisa digunakan di lingkungan komersial
    • Saya bertanya-tanya lisensi ini sebenarnya berlaku untuk apa tepatnya; mungkin selain kode Python yang mudah diimplementasikan ulang, saya rasa tidak ada hak cipta di sana
    • Posisi saya adalah bahwa bobot model bukanlah karya kreatif yang bisa diberi hak cipta sejauh yang diinginkan perusahaan, dan juga tidak termasuk dalam definisi hukum hak cipta
    • Ditekankan bahwa tidak seperti database atau perangkat lunak, bobot model tidak memenuhi syarat hak cipta, dan terlepas dari seberapa besar kreativitas yang masuk, itu bukan objek perlindungan hak cipta
  • Saya ingin memakai model seperti Kontext dengan cara menyelesaikan gambar sambil berkolaborasi dengan AI secara real-time di atas kanvas

    • Saya benar-benar berharap akan muncul pengalaman seperti “partner melukis real-time”, yang menggabungkan inovasi prediksi deret waktu di ranah LLM dengan sesuatu seperti dataset Google Quick Draw, sehingga kita bisa menyelesaikan gambar sambil “berdialog” dengan kuas
      • Saat mencoba model Kontext dari Fal.ai, fitur slider transformasi sebelum-dan-sesudah serta kemampuan untuk terus merevisi lewat gambar hasil edit terasa mengesankan
      • Karena BFL kini bahkan telah merilis model dev, saya juga sangat berharap akan muncul plugin Kontext untuk Krita, yang sebelumnya sudah punya plugin untuk Stable Diffusion
      • Tautan referensi plugin Krita
  • Saya penasaran sistem ini berjalan pada kisaran VRAM berapa

    • Untuk saat ini dibutuhkan sekitar 18~20GB VRAM, tetapi besok atau dalam waktu dekat, jika ada waktu luang sekitar 1 jam, ini bisa berjalan bahkan di 4GB VRAM
  • Sayang sekali lisensinya bersifat membatasi