- FLUX.1 Kontext [dev] adalah versi open weight yang dirilis gratis dari model pengeditan gambar generatif yang sebelumnya bersifat eksklusif
- Dengan 12B parameter, model ini dapat berjalan pada hardware kelas konsumen dan didistribusikan gratis untuk riset serta penggunaan nonkomersial
- Menyediakan performa pengeditan gambar berkualitas tinggi setara komersial seperti pengeditan lokal/global yang detail, menjaga konsistensi karakter, dan revisi berulang, serta dapat langsung terintegrasi dengan framework populer seperti ComfyUI, Hugging Face Diffusers, dan TensorRT
- Dalam evaluasi performa, model ini menunjukkan hasil yang lebih baik dibanding model terbuka maupun tertutup yang sudah ada (misalnya Google's Gemini-Flash Image)
- Varian TensorRT yang dioptimalkan untuk arsitektur NVIDIA Blackwell (BF16, FP8, FP4) juga disediakan, menghadirkan peningkatan besar dalam kecepatan dan efisiensi pada hardware terbaru
- Melalui lisensi komersial dan portal swalayan, model ini juga mudah diintegrasikan dan dimanfaatkan dalam bisnis
Pengenalan dan Pentingnya
- FLUX.1 Kontext [dev] adalah model pengeditan gambar generatif terbaru yang dirilis oleh Black Forest Labs
- Selama ini, model unggulan untuk pembuatan/pengeditan gambar sebagian besar tersedia secara eksklusif, tetapi kini beralih menjadi open weight sehingga siapa pun dapat menggunakannya untuk riset dan tujuan nonkomersial
- Model ini terdiri dari 12B parameter, menawarkan performa unggul sekaligus efisien sehingga dapat berjalan pada hardware konsumen umum
Rilis dan Aksesibilitas
- FLUX.1 Kontext [dev] dirilis di bawah lisensi nonkomersial FLUX.1, dan tersedia gratis bagi pengguna untuk riset dan tujuan nonkomersial
- Bobot model dapat diunduh dengan mudah dari HuggingFace dan kompatibel dengan framework AI utama seperti ComfyUI, HuggingFace Diffusers, dan TensorRT
- Mitra seperti FAL, Replicate, Runware, DataCrunch, dan TogetherAI menyediakan endpoint API serta kode yang dapat langsung digunakan di lingkungan cloud maupun lokal
Standar Baru di Bidang Pengeditan Gambar
- FLUX.1 Kontext [dev] dikhususkan untuk tugas pengeditan gambar
- Unggul dalam mempertahankan karakter pada pengeditan berulang serta di berbagai adegan dan lingkungan
- Mendukung pengeditan lokal dan keseluruhan yang presisi
- Black Forest Labs menargetkan penyediaan alat terbuka yang sebanding dengan model proprietary
- Dalam benchmark skala besar (seperti KontextBench), model ini membuktikan performa yang unggul dibanding model terbuka yang sudah ada seperti ByteDance Bagel dan HiDream-E1-Full, serta model komersial seperti Google Gemini-Flash Image
- Evaluasi independen oleh lembaga eksternal seperti Artificial Analysis juga mengonfirmasi hasil yang konsisten
Optimasi Hardware dan Berbagai Pilihan
- Bekerja sama dengan NVIDIA, tersedia bobot TensorRT yang dioptimalkan untuk arsitektur Blackwell terbaru (versi BF16, FP8, FP4 yang dioptimalkan untuk energi dan kecepatan)
- Pengembang dapat dengan mudah memilih keseimbangan kecepatan, efisiensi, dan kualitas sesuai kebutuhan
Lisensi dan Portal untuk Pemanfaatan Komersial
- Black Forest Labs membuka portal lisensi swalayan dengan syarat yang transparan, menyederhanakan akses komersial/nonkomersial untuk semua model open weight
- Perusahaan dapat dengan mudah membeli lisensi melalui portal tersebut, lalu dengan cepat mengintegrasikan model keluarga FLUX.1 ke dalam layanan bisnis
Pembaruan Lisensi
- Definisi tujuan nonkomersial diperjelas untuk memberikan batasan cakupan yang diizinkan dan pembatasan secara lebih spesifik
- Ditambahkan klausul filter konten untuk mencegah pembuatan konten ilegal/melanggar hak, sekaligus melengkapi klausul penafian terkait
- Pengelolaan asal konten dan riwayat pembuatan diatur agar mematuhi peraturan perundang-undangan terkait
- Ditambahkan contoh yang jelas serta batasan untuk kasus penggunaan yang tidak diperbolehkan
Referensi dan Dukungan
- Model/kode/dokumentasi
- Laporan teknis terkait rilis FLUX.1 Kontext [dev] dapat dibaca di arxiv
- Baik pengguna maupun perusahaan dapat mengakses berbagai API, dokumentasi, dan data benchmark
1 komentar
Komentar Hacker News
Hal yang sangat keren adalah BFL merilis bobot model, dan di tengah kenyataan bahwa keberlanjutan finansial open source itu sulit, menurut saya pendekatan memberi akses gratis ke kalangan akademik dan mengenakan biaya lisensi yang wajar kepada startup adalah cara yang memungkinkan BFL dan perusahaan lain terus merilis model open-weight
Hal menarik dari merilis open weight adalah kita bisa menambahkan kemampuan baru (tugas) ke model editing seperti ini
Saya berharap model Dev yang sudah didistilasi tetap mempertahankan performa yang cukup baik dibandingkan model Pro/Max yang lebih besar
Saya sempat mencoba sistem ini langsung di hackathon yang diadakan minggu lalu di San Francisco, dan kesannya cukup mengesankan
Rasanya niat dari lisensi ini adalah menjadi semacam penyaringan awal yang membatasi siapa saja yang bisa mengaksesnya
Lisensi penggunaan nonkomersial yang baru diterapkan punya aturan yang cukup rumit, dan bisa merujuk ke teks lisensi lengkap
Saya ingin memakai model seperti Kontext dengan cara menyelesaikan gambar sambil berkolaborasi dengan AI secara real-time di atas kanvas
Saya penasaran sistem ini berjalan pada kisaran VRAM berapa
Sayang sekali lisensinya bersifat membatasi