21 poin oleh GN⁺ 2025-09-12 | 1 komentar | Bagikan ke WhatsApp
  • Kumpulan contoh open-source yang menghimpun beragam contoh tugas pembuatan dan penyuntingan gambar dengan Google Nano-banana
  • Menunjukkan kemampuan transformasi kreatif dan penyuntingan multi-gambar dengan memanfaatkan teknologi pembuatan gambar Google
  • Setiap kasus adalah contoh penggunaan nyata yang dikumpulkan dari komunitas seperti Twitter/X, Xiaohongshu, dan lainnya
  • Menyediakan beragam contoh transformasi eksperimental dan terapan dengan menggabungkan prompt teks dan gambar masukan
  • Panduan perancangan prompt dan input dirangkum dalam dokumentasi sehingga siapa pun bisa langsung menggunakannya

Gambaran Umum

  • Repositori ini adalah galeri kurasi yang mengumpulkan berbagai gambar dan contoh prompt yang dibuat dengan teknologi pembuatan dan penyuntingan gambar Nano-banana
  • Sembari menunjukkan kemungkinan tak terbatas dari pembuatan dan penyuntingan gambar Google, repositori ini membantu pemahaman tentang Nano-banana dan memungkinkan pengguna merasakan kekuatan penggabungan multi-gambar serta penyuntingan kreatif
  • Contoh-contoh terutama dikumpulkan dari Twitter/X, Xiaohongshu, dan platform media mandiri lainnya
  • Mencatat tanggal pembaruan repositori terbaru dan riwayat versinya

Menu

Setiap kasus terdiri dari kombinasi gambar masukan dan prompt, serta contoh hasil keluaran.

Contoh Input & Prompt

  • Input: memerlukan berbagai tipe seperti gambar referensi, gambar Google Maps, foto orang, sketsa, gambar material, dan lainnya
  • Prompt: mencakup permintaan detail dalam bahasa Inggris untuk transformasi gambar, penyuntingan, desain, koreksi warna, dan sebagainya

Struktur Prompt Representatif

  • Dapat digunakan untuk transformasi gaya orang atau objek, gaya rambut, latar belakang, dan lainnya
  • Bisa dimanfaatkan untuk berbagai tujuan seperti produk, bangunan, karakter, makanan, gaya komik, foto identitas, mockup, dan lain-lain
  • Bagian [bracket] dapat diubah sesuai tujuan penggunaan untuk memberi panduan yang lebih rinci

Alur Contoh

  • Unggah gambar → masukkan prompt → periksa hasil keluaran (tautan gambar)
  • Sebagian disajikan dalam bentuk tabel 'input/hasil', sebagian lain hanya menyediakan hasil keluaran

Ringkasan Contoh Utama per Kasus

  • Transformasi karakter/produk: menghasilkan foto orang menjadi gaya karakter, figur, LEGO, atau paket bergaya Gundam
  • Cosplay/desain: membuat foto cosplay berbasis ilustrasi, tampak 3 sisi karakter, dan lembar ekspresi
  • Koreksi/restorasi gambar: restorasi foto lama, penghapusan latar belakang transparan, peningkatan warna dan kecerahan, pemulihan noise
  • Komposisi/peralihan gaya: komik 4 panel hitam-putih tanpa dialog, transformasi gaya komik, miniatur, penerapan material/filter, perubahan gaya rambut/riasan
  • Visualisasi data: infografik ringkasan blog/artikel, tampilan kalori dan kandungan gizi
  • Edukasi/presentasi: gambar model usus, penyelesaian soal matematika, penambahan anotasi penjelas, dan lainnya

Panduan Prompt dan Referensi

  • Setiap prompt dan penjelasan kasus menyediakan panduan kustom untuk nilai input dan [isi pengganti]
  • Dapat diterapkan untuk cerita, papan fesyen, lembar pose, dan lainnya dengan menggabungkan beberapa gambar
  • Hasil teknis seperti wireframe, hologram, dan representasi 3D juga dimungkinkan

Partisipasi Komunitas dan Ucapan Terima Kasih

  • Materi terus ditambahkan dengan kontribusi para pembagi contoh nyata di komunitas AI
  • Ide penggunaan baru atau karya kreatif dapat diusulkan secara bebas

Makna dan Keunikan Proyek

  • Ini adalah repositori GitHub yang merangkum secara kaya contoh penerapan nyata dari algoritme pembuatan gambar terbaru
  • Opsi terperinci prompt Nano-banana, hasil keluaran, dan cara penerapan per kasus bisa dilihat sekilas dalam satu tempat
  • Memberikan nilai referensi dan kepraktisan tinggi bagi desainer praktis, peneliti AI, pengembang, dan siapa pun
  • Setiap contoh dapat dengan mudah digunakan ulang untuk berbagai tujuan penyuntingan, pembuatan, dan transformasi gambar

1 komentar

 
GN⁺ 2025-09-12
Komentar Hacker News
  • Saya terkesan dengan hasil Nano-Banana yang benar-benar luar biasa. Saya mengelola situs web perbandingan model gambar mutakhir yang menjadikan seberapa akurat hasil keluar dari berbagai prompt teks-ke-gambar sebagai kriteria utama. Baru-baru ini saya juga menambahkan Editing Comparison Showdown untuk mengevaluasi kemampuan mengedit bagian tertentu dari gambar yang sudah ada lewat teks. Saat ini saya membandingkan 6 model multimodal (Nano-Banana, Kontext Max, Qwen 20b, dll.). Hasilnya bisa dilihat di sini. Gemini Flash 2.5 berada di peringkat pertama dengan 7 dari 12 poin, sedangkan Kontext mendapat 5 poin, dan itu cukup mengesankan mengingat bahkan model pengembangannya bisa dijalankan secara lokal
    • Saya sering mengalami Nano Banana menghasilkan gambar yang sama meskipun saya secara jelas memintanya mengubah sesuatu secara besar. Kadang-kadang, secara aneh, hasil yang benar justru keluar, jadi kalau ada yang pernah mengalami ini atau tahu solusinya, kabari saya
    • Model ini masih belum bisa menampilkan jam dengan benar (misalnya jam yang menunjukkan 1:15 am). Teks yang dihasilkan di gambar kartun juga masih belum 100% akurat
    • Saya sarankan menambahkan gpt-image-1. Ini bukan model editing dalam arti yang ketat karena mengubah piksel secara global, tetapi saat menangani prompt yang sangat kompleks dan referensi gambar, model ini terasa lebih patuh pada instruksi daripada Nano Banana
  • Saya terkesan bahwa model ini praktis hanya dibatasi oleh imajinasi, dan biayanya cuma $0.04 per gambar. Tidak tertulis di halaman itu, tetapi ini adalah model Google Gemini Image Generation (dokumentasi resmi). Kumpulan contohnya juga bagus. Namun saya agak heran karena contoh kedua terasa agak kurang pantas untuk lingkungan kerja
    • Saya ingin menekankan bahwa Nano Banana dioptimalkan khususnya untuk editing gambar (info lebih lanjut)
    • Saya penasaran apakah ini satu model tunggal atau sebuah pipeline model
  • Beberapa contoh mengandung unsur NSFW. Di sebagian besar industri teknologi AS, membagikan URL utama itu bisa jadi sensitif, jadi mungkin lebih baik menampilkan hanya contoh individual yang aman. Sebagai referensi, setengah dari Case 1 adalah perempuan bergaya anime/kartun dengan kostum maid yang mengangkat roknya hingga pakaian dalamnya terlihat. Menurut saya itu bagian paling bermasalah dari contoh yang langsung terlihat pengunjung di halaman pertama
    • Saya benar-benar terkejut bahwa mereka menghasilkan contoh dengan pakaian dalam terekspos itu. Saat saya memakai Nano Banana (filter keamanan diatur ke 'off'), model ini menolak membuat gambar gaya manga berisi helm samurai terkutuk dan mayat yang tergeletak
    • Yang lebih mengganggu bagi saya adalah gambar referensinya jelas merupakan digital art berkualitas tinggi buatan seorang seniman. Terlepas dari persoalan hukum di bidang AI/LLM, secara moral terasa tidak nyaman melihat karya orang lain dipakai terang-terangan di dokumentasi resmi
  • Saya sungguh tidak paham kenapa orang-orang mendapatkan hasil yang bagus. Saya mencoba memilih Nano Banana (gemini-2.5-flash-image-preview) di sini, dan hasilnya benar-benar sampah. Saya mengunggah foto referensi karakter dan sebuah adegan lalu memintanya menempatkan karakter itu ke adegan tersebut, tetapi model ini cuma menempel potongan gambar begitu saja, meski gaya dan warnanya tidak cocok. Hasil ChatGPT malah lebih baik (meski kadang juga tidak mirip, setidaknya jauh lebih baik daripada sesuatu yang dibuat dalam 2 menit di Paint). Apa mungkin saya memakai model yang salah?
    • Saya mengalami hal yang sama. Saat Nano Banana bekerja dengan baik, hasilnya memang sangat bagus, tetapi 90% sisanya terlihat aneh atau berkualitas rendah. Rasanya seperti tempel-potong atau paint-over, dan permintaan yang masuk akal pun ditolak dengan alasan "safety" (dari pengalaman saya, gambar yang melibatkan orang nyata hampir selalu tidak bisa). Bukannya mengesankan, malah bikin kesal
    • Dari pengalaman saya, Nano Banana sangat agresif memakai copy-paste kalau menurutnya itu sudah cukup. Jadi prompt harus dibuat jelas bahwa karakter harus terintegrasi secara alami ke dalam adegan. Artinya, kalau diprompt dengan benar model ini jauh lebih unggul daripada model lain, tetapi proses merancang prompt-nya sendiri merepotkan dan melelahkan
    • Cobalah mengubah prompt sedikit demi sedikit, atau minta Gemini 2.5 pro memperbaiki prompt lalu berikan hasilnya ke Gemini 2.5 Flash, sambil diulang untuk mempelajari apa yang efektif
    • Saya juga sama, hasilnya benar-benar seperti sampah. Saya mengunggah foto istri saya (32 tahun) untuk mencoba melihat bagaimana kalau dia punya poni, tetapi sebagian besar ditolak karena masalah safety. Kalaupun sesekali berhasil, wajahnya jadi seperti orang lain. Hanya sekali hasilnya benar, tetapi saya tidak bisa menyesuaikan poni, dan model terus mengembalikan hasil yang sama sambil sering menampilkan "konten diblokir"
  • Secara pribadi, performa model ini di bawah ekspektasi saya. Gambar contoh tampaknya sangat dipilih-pilih. Saya bagikan beberapa kegagalan yang saya alami: tidak bisa menghapus bayangan berat di wajah dari foto, ketika diminta mewarnai foto hitam-putih lama menjadi warna tajam ala DSLR modern hasilnya cuma jadi agak pudar, saat diminta grid gaya rambut 3x3 model terus mengulang 2x3 lalu akhirnya memang 3x3 tetapi rasnya bercampur, dan juga tidak bisa menggabungkan gambar nyata dengan gambar generatif (misalnya gambar lumba-lumba memakai tutu terlihat seperti tempel-tempel yang kasar)
    • Contoh highlight gedung AR itu keren. Dengan prompt yang sama, model ini bisa menyorot gedung paling menonjol di skyline dengan baik, tetapi kalau diminta menunjuk gedung lain justru gagal total. Pada gambar Midtown Manhattan, saya memintanya mencari dan menyorot Chrysler Building, tetapi ia bilang "tidak ada di gambar", dan saat diminta 432 Park Ave malah muncul gedung acak di tengah gambar. Pada foto museum campus Chicago juga, ketika saya meminta gedung tertentu, malah menyorot Hancock Center yang sebelumnya tidak terlihat. Penjelasannya juga salah, dan kadang teksnya rusak
    • Contohnya sendiri juga tidak sempurna. Prompt "foto saya di berbagai era" sepenuhnya mengubah wajah meski diminta "jangan ubah wajah", "OOTD Outfit" memakai kamera yang salah, "Virtual Makeup Try-On" gagal menampilkan makeup, "Lighting Control" kacau dalam mengendalikan pencahayaan, dan "Design a Chess Set" katanya tidak perlu gambar input padahal ternyata perlu, jadi banyak hasil yang menimbulkan tanda tanya. Meski begitu, ini masih berguna bagi orang yang tidak memakai Photoshop atau yang butuh draf awal untuk mulai mengerjakan sesuatu secara manual
    • Sebenarnya, menurut saya wajar kalau demo promosi proyek apa pun selalu memilih contoh yang bagus-bagus
  • Saya baru-baru ini merilis paket Python untuk memudahkan pembuatan gambar Nano Banana (tautan github). Saat mengujinya, saya menemukan tren prompt engineering yang menarik: a) menggunakan daftar Markdown bergaya LLM dan b) memakai keyword gaya gambar AI lama seperti "award-winning" dan "DSLR camera" ternyata sangat efektif di Gemini 2.5 Flash Image. Model ini punya text encoder dan dataset pelatihan yang lebih besar, sehingga lebih baik dalam membedakan fitur apa yang dimiliki suatu formula yang nyata. Dokumentasi developer Google juga merekomendasikan penggunaan keyword seperti ini. Selain itu, berkat context window 32k, jadi mungkin untuk melakukan eksperimen menarik seperti merender HTML menjadi gambar atau mendapatkan hasil yang konsisten dari input JSON yang rumit
  • Menurut saya ini kemajuan yang luar biasa. Belum lama ini saja masih sulit membuat karakter yang sama muncul berulang kali secara konsisten. Sekarang kita melihat tingkat komposisi dan konsistensi seperti ini. Laju perkembangan model generatif benar-benar luar biasa. Terima kasih kepada pembuat dan para kontributor yang telah mengumpulkan begitu banyak contoh. Itu sangat membantu untuk memahami sebenarnya alat ini seperti apa
  • Saya baru sadar bahwa dulu saya cukup senang percaya kalau kemampuan membayangkan sesuatu di kepala, seperti perubahan gaya rambut, adalah keistimewaan manusia. Sekarang melihat mesin bisa mereproduksi kemampuan itu setara atau bahkan melampaui imajinasi saya, saya jadi sedikit tidak nyaman, seolah-olah imajinasi saya mungkin tidak lebih istimewa daripada kekuatan saya mengangkat hanger baju
    • Saya justru tipe orang yang tidak bisa membayangkan gambar di kepala seperti itu, jadi saya selalu berpikir secara intelektual dan logis, dan imajinasi Anda tetap merupakan kemampuan yang istimewa. Bagi kebanyakan orang, itu benar-benar terasa seperti kekuatan super. Saya ingin mengibaratkan AI sebagai Batman (kuat kalau punya uang dan sabuk utilitas, tetapi tanpa itu tidak berdaya), sedangkan imajinasi manusia adalah Superman (kemampuan bawaan yang bisa dipakai kapan saja)
    • Saya rasa kemampuan untuk melihat gambar yang dibayangkan di kepala lalu merasa senang, tertawa, terkejut, atau terguncang karenanya itu sungguh istimewa. Manusia punya alasan untuk ada dan punya emosi; kita bisa memandang matahari terbenam sambil memikirkan hamburan cahaya, atau sekadar menikmati rasa takjubnya. Setiap kali kita benar-benar menerima momen yang sedang terjadi, rasanya seperti sihir. Fakta bahwa saya bisa membalas Anda, dan bahwa Hacker News ada, terasa seperti keajaiban
    • Saya punya aphantasia (alias ketidakmampuan membayangkan citra visual di kepala), dan sekarang saya senang karena semua orang jadi bisa membayangkan pada kondisi yang sama
    • Saya penasaran apakah ke depan mesin bisa secara mandiri menciptakan gaya seni baru. Misalnya, gaya manga/anime berubah dari masa ke masa, dan kalau manusia berhenti mendorong evolusi itu, apakah mesin bisa terus mengembangkannya? Secara prinsip mungkin saja (manusia juga mesin biologis), tetapi dengan arsitektur AI saat ini saya rasa itu masih jauh
    • Kalau mau adil, kemampuan model ini sendiri ada berkat data pelatihan yang kita ciptakan
  • Saya benar-benar menggunakan Nano Banana dengan sangat berguna. Saya memakainya untuk membuat buku mewarnai berbasis foto bagi anak saya dan anak-anak teman saya (contoh dan kode). Model ini menghasilkan gambar yang cukup mempertahankan nuansa buku mewarnai hitam-putih, sambil tetap menyisakan sebagian detail dari foto aslinya
  • Saya merasa tidak nyaman karena terlalu banyak contoh perempuan muda yang dipresentasikan secara seksual. Case 1/B adalah adegan karakter perempuan mengangkat rok hingga memperlihatkan pakaian dalam. Ini model yang sangat mengesankan, tetapi rasanya PR-nya jadi rusak karena konten yang kekanak-kanakan seperti ini. Hitungan saya ada 26 contoh perempuan muda dan 9 laki-laki. Sebagai catatan, cuma kasus 'Lena' yang tidak ada (referensi Lenna)
    • Awalnya saya juga merasa tidak nyaman dengan hal yang sama. Entah karena kita semua sudah makin tua atau bagaimana, tetapi memang terasa begitu
    • Saya mengakui bahwa pendorong perkembangan teknologi selalu hasrat seksual, suka atau tidak. VHS, pembayaran online, streaming video, semuanya pada akhirnya didorong oleh permintaan seperti itu. Saya juga jadi teringat lagu terkenal "Internet is for porn"
    • Coba cari tahu apa yang dulu dipahat oleh para pematung prasejarah, Anda akan lebih terkejut lagi. Sebelum membuka situsnya saya membaca komentar dan melihat Case 1 itu anak kecil lalu berikutnya maid seksi, jadi pikiran pertama saya adalah "oh tolong, jangan bilang dua hal ini digabung jadi satu gambar".