- Menggabungkan fitur canggih Nano Banana Pro dengan kecepatan Gemini Flash, sehingga memungkinkan generasi gambar berkecepatan tinggi dan iterasi pengeditan
- Menyediakan fitur kelas pro dengan kecepatan tinggi seperti rendering berbasis pengetahuan dunia, representasi dan terjemahan teks yang akurat, menjaga konsistensi subjek, dan dukungan resolusi 4K
- Diterapkan di berbagai aplikasi Google: aplikasi Gemini, Search, AI Studio dan Gemini API, Flow, Google Ads, dan lainnya
- Menggabungkan SynthID dan C2PA Content Credentials untuk memperkuat fungsi identifikasi dan verifikasi asal-usul konten yang dihasilkan AI
- Google terus berkembang melalui Nano Banana 2 ke arah yang sekaligus meningkatkan keandalan dan kegunaan media generatif
Ikhtisar Nano Banana 2
- Nano Banana 2 (Gemini 3.1 Flash Image) yang diperkenalkan Google DeepMind adalah model yang menggabungkan fitur canggih Nano Banana Pro yang sudah ada dengan kecepatan Gemini Flash
- Model sebelumnya, Nano Banana, menjadi sorotan karena mendefinisikan ulang cara pembuatan dan pengeditan gambar, sementara Nano Banana Pro menawarkan kontrol tingkat studio
- Versi kali ini mengintegrasikan keunggulan kedua model untuk mewujudkan pembuatan gambar berkualitas tinggi dan kecepatan pemrosesan yang cepat secara bersamaan
- Nano Banana 2 memiliki karakteristik seperti pengetahuan dunia tingkat lanjut, rendering teks yang akurat, konsistensi subjek, dan dukungan spesifikasi untuk produksi
Kecerdasan dan kualitas visual dengan kecepatan Flash
- Nano Banana 2 menerapkan kecerdasan berkecepatan tinggi Gemini Flash ke generasi visual untuk mendukung pengeditan cepat dan pekerjaan iteratif
- Pengetahuan dunia tingkat lanjut: mengekspresikan topik tertentu dengan lebih akurat menggunakan informasi real-time Gemini dan data berbasis gambar web
- Hal ini memungkinkan pembuatan infografik, diagram, dan visualisasi data
- Melalui fitur rendering dan terjemahan teks yang akurat, model ini dapat menghasilkan teks yang jelas saat membuat mockup pemasaran atau kartu, serta menerjemahkan dan melokalkan teks di dalam gambar
Fitur kontrol kreatif yang ditingkatkan
- Nano Banana 2 memperkecil kesenjangan antara kecepatan dan fidelitas visual untuk menghasilkan gambar berkualitas tinggi dan realistis dengan cepat
- Konsistensi subjek: menjaga konsistensi hingga 5 karakter dan 14 objek dalam workflow yang sama
- Eksekusi instruksi yang akurat: merefleksikan nuansa detail dari permintaan yang kompleks dengan setia
- Spesifikasi untuk produksi: mendukung resolusi 512px hingga 4K dan berbagai rasio, dari posting sosial hingga latar lebar
- Peningkatan fidelitas visual: menghadirkan tekstur, pencahayaan, dan detail yang lebih kaya
Integrasi produk dan aksesibilitas
- Nano Banana 2 sedang diterapkan secara bertahap di seluruh ekosistem Google
- Aplikasi Gemini: Nano Banana 2 disematkan secara default pada model Fast, Thinking, dan Pro, sementara pelanggan Pro dan Ultra tetap dapat menggunakan model Pro
- Search: dapat digunakan di mobile dan desktop melalui mode AI dan Lens, dengan dukungan tambahan untuk 141 negara dan 8 bahasa
- AI Studio dan Gemini API: tersedia dalam versi pratinjau, dan juga dapat digunakan di Vertex AI
- Flow: ditetapkan sebagai model generasi gambar dasar yang tersedia gratis bagi semua pengguna
- Google Ads: diterapkan pada fitur saran gambar saat membuat kampanye iklan
Penguatan verifikasi sumber dan keandalan
- Google menggabungkan SynthID dan C2PA Content Credentials untuk meningkatkan keandalan media generatif
- Melalui kombinasi ini, tersedia bukan hanya apakah AI digunakan, tetapi juga informasi konteks tentang bagaimana AI digunakan
- Fitur verifikasi SynthID telah digunakan lebih dari 20 juta kali sejak peluncuran, untuk mengidentifikasi gambar, video, dan audio yang dihasilkan AI
- Fitur verifikasi C2PA juga akan segera ditambahkan ke aplikasi Gemini
Ringkasan
- Nano Banana 2 adalah model generasi gambar terbaru Google yang menghadirkan kecepatan, akurasi, dan kualitas sekaligus
- Terintegrasi di seluruh ekosistem Gemini, sehingga segera dapat dimanfaatkan oleh pengembang, desainer, dan pemasar
- Menjadi contoh evolusi strategis Google yang sekaligus mengejar transparansi konten AI dan peningkatan produktivitas kreatif
1 komentar
Komentar Hacker News
Mencoba membuat beberapa prediksi tentang dampak alat pembuat gambar AI terhadap seni
Jika teknologi berkembang, bahkan "selera" pun mungkin bisa diselesaikan secara teknis. Saat ini AI dianggap "tidak keren", tetapi itu mungkin hanya persoalan tahap perkembangan
Seperti contoh SpaceX, menggunakan target yang belum tercapai sebagai dasar untuk meremehkan keseluruhan adalah kritik yang keliru
Sebaliknya, saya pikir "emergent design" akan menjadi tren berikutnya. Misalnya, Czinger menunjukkan pendekatan mencari bentuk melalui optimisasi probabilistik
Misalnya, sekalipun Sora membuat video sepak bola yang sempurna, para penggemar tetap akan menonton pertandingan sungguhan. Kita menikmati seni karena ada keterhubungan emosional bahwa itu dibuat oleh manusia
Jadi saya ingin bertanya kepada orang yang berkata "seni AI itu keren" — "kalau begitu, untuk apa seni itu?"
Saya sudah melihat banyak karya keren buatan seniman sungguhan yang menggunakan AI, dan saya menantikan eksperimen kreatif apa lagi yang akan muncul dari alat ini
Saya sedang membangun rumah sekarang, dan model gambar Nano Banana benar-benar mengubah permainan dalam proses desain
Saya menjalankan ratusan render untuk menemukan desain yang saya suka, lalu mencerminkannya ke rancangan desainer interior
CAD sulit mengekspresikan kurva atau elemen dekoratif, tetapi Nano Banana sangat bagus dalam menghasilkan desain organik
Hasilnya, rumahnya jadi jauh lebih keren
Contoh terkait bisa dilihat di blog ini
Kecuali beberapa ide orisinal yang diajukan desainer, untuk sebagian besar hal Gemini lebih baik
Masih terasa menakjubkan bahwa kita bisa mengubah warna, furnitur, dan tata letak hanya dalam beberapa detik
Belakangan ini gambar AI terlalu realistis, sehingga orang awam sering mengiranya foto sungguhan
Misalnya seperti foto makanan di Facebook atau gambar model palsu.
Daya ekspresinya memang membaik, tetapi pada saat yang sama terasa ada sisi yang meresahkan
Ada kasus yang jelas, tetapi sebagian besar tidak mungkin dibedakan
Sekarang siapa pun bisa membuat gambar palsu, jadi orang akan secara alami belajar memverifikasi sumber dan menilai kepercayaan
Dalam jangka panjang, gambar akan menjadi komoditas dan kehilangan nilai emosionalnya
Dulu satu foto itu berharga, sekarang hanya satu dari ribuan.
Hal yang sama berlaku untuk seni AI; kalau jumlahnya terlalu banyak, dampak emosionalnya berkurang
Saya memotret foto pernikahan, dan dalam 2 tahun terakhir permintaan pemotretan film meningkat tajam.
Popularitas piringan hitam atau kamera digital lama juga ada dalam konteks yang sama
Contoh ekspresi cubism pada model baru agak mengecewakan
Inti cubism adalah memuat berbagai sudut pandang, waktu, dan gaya dalam satu bidang,
tetapi AI hanya meniru pembagian geometris saja. Rasanya masih lebih meniru "bentuk" daripada "makna"
Sebelumnya ia membuat bangunan acak, tetapi sekarang ia mencari dan merujuk pada data nyata
Contoh detailnya bisa dilihat di halaman DeepMind Gemini Image Flash
Kalau AI seperti ini ada di masa lalu, mungkin karya seperti Mona Lisa atau langit-langit Kapel Sistina tidak akan pernah ada
Karena itu bisa dibuat lebih murah lewat prompt
AI adalah alat yang bisa menaikkan batas itu lebih tinggi
Semakin maju teknologinya, semakin hilang "kelangkaan", dan nilai yang sesungguhnya akan terkonsentrasi pada sistem kontrol
Para maestro masa lalu dikenang berkat patron, tetapi kreator masa kini justru terkubur karena tuntutan nafkah
Seperti kata Terence McKenna, masa depan akan bergerak ke arah yang semakin aneh dan kontradiktif
Lihat video terkait di tautan ini
Misalnya, "gambar Yesus menancapkan bendera di bulan" mungkin bisa, tetapi "gambar jacquesm menancapkan bendera di bulan" akan berantakan
Saya menguji hasil
gemini-3.1-flash-image-preview(NB 2) di GenAI ShowdownPeningkatan dari NB → NB Pro cukup besar, tetapi dari NB Pro → NB Pro 2 tidak ada peningkatan besar
Secara khusus, kualitas editing lokal (localization) justru menurun
Lihat perbandingan detail di tautan ini
Saya sempat mencoba NB Pro 2 sebentar, dan ini lebih terasa sebagai peningkatan bertahap daripada lompatan fungsional
Meski begitu, cukup mengejutkan bahwa ia lolos "King Louie jump rope test"
Hasil pengujiannya bisa dilihat di halaman ini
Untuk editing foto pribadi, pembatasan deteksi figur publik masih terlalu kuat
Hampir semua orang dikenali sebagai "mirip figur publik", sehingga tidak bisa diedit
Dari sudut pandang engineering ini teknologi yang keren, tetapi saya ragu apakah ada dasar penggunaan yang sah secara bisnis
Kebanyakan rasanya dipakai karena "tidak mau membayar artis"
Ketika perusahaan besar menyebarkan konten dalam skala besar, dampak negatifnya justru bisa lebih besar
Efisiensi seperti ini sangat bisa diterapkan juga pada bisnis kecil