- Tanpa akses ke encoder/decoder SynthID milik Google, proyek ini merekonstruksi struktur watermark tak kasatmata pada gambar Gemini hanya dengan pemrosesan sinyal murni dan analisis spektrum
- Temuan utama: SynthID menyisipkan carrier pada posisi frekuensi yang berbeda untuk tiap resolusi, dan di antara gambar yang dihasilkan model yang sama terdapat konsistensi template fase di atas 99,5% — pada praktiknya merupakan pola tetap
- Metode JPEG compression dan injeksi noise yang ada menyebabkan penurunan kualitas besar, tetapi pendekatan pengurangan codebook spektrum multi-resolusi V3 mencapai penurunan konsistensi fase 91% sambil mempertahankan PSNR di atas 43dB
- Profil per resolusi disimpan dalam codebook, lalu disesuaikan dengan gambar masukan untuk pemilihan otomatis → pengurangan di domain FFT → iterasi multi-pass guna menghapus watermark yang tersisa
- Sinyal watermark paling kuat di kanal Green, dan penghapusan presisi dilakukan dengan menerapkan bobot per kanal (G=1.0, R=0.85, B=0.70)
- Detektor mengeluarkan keberadaan watermark dan tingkat keyakinannya dengan akurasi 90%, menggunakan analisis multi-skala berbasis codebook
- Proyek ini ditujukan untuk riset dan edukasi, dan dilarang digunakan untuk membuat gambar buatan AI disalahartikan sebagai buatan manusia
- Ditulis dengan Python, dengan seluruh kode dibuka di GitHub
1 komentar
Opini Hacker News
Menyisipkan watermark 1-bit yang tak terdeteksi ke gambar berisi jutaan piksel sebenarnya tidak terlalu sulit
Jika diasumsikan Google cukup kompeten, kemungkinan mereka memakai dua jenis watermark — satu versi longgar yang dipublikasikan ke luar, dan satu lagi versi privat untuk internal atau permintaan penegakan hukum
Selain itu, jika Google yang melakukannya, kemungkinan semua gambar yang dihasilkan (atau neural hash-nya) akan disimpan di database dan dikaitkan dengan akun
Mengasumsikan lapisan eksternal pada akhirnya akan ditembus, lalu tetap mempertahankan lapisan kedua yang tidak bisa diuji secara publik, adalah prinsip dasar keamanan
Namun, dengan model yang terus diperbarui dan punya sifat non-deterministic, saya penasaran apakah pengguna benar-benar bisa membuktikannya
Kualitas repo ini rendah jika disebut sebagai riset berbantuan AI, dan juga tidak membandingkannya dengan detektor SynthID milik Google secara layak
Sebenarnya, hanya dengan bantuan LLM pun, orang bisa melakukan reverse engineering pada request jaringan dan mengimplementasikan deteksi SynthID tanpa browser atau Gemini. Itu yang seharusnya menjadi ground truth sesungguhnya
Juga sering terlihat serangan ke sumber atau meremehkannya dengan bilang “ini ditulis AI”
Belakangan komunitas HN terasa makin berubah menjadi anti alat AI
Hari ini saya merasa melihat watermark pada gambar yang dibuat dengan Nano Banana
Saya menyalin gambar dari Chrome ke Slack, dan hasilnya hanya terlihat sebagai kotak hitam dengan titik merah
Saya penasaran apakah mungkin itu jenis kesalahan yang sama
Saya memang tahu pada akhirnya seseorang akan membuat hal seperti ini, tapi saya tidak paham kenapa orang sengaja ingin menghilangkan sarana deteksi gambar hasil AI
Kalau hanya pihak jahat yang tahu, justru lebih berbahaya
Publik tidak memahami logika biner seperti “tidak ada watermark berarti gambar ini asli”
Pada akhirnya AI watermarking memang ditakdirkan gagal
Lagi pula, di masa lalu kita juga tidak menempelkan watermark tak terlihat pada media yang dimanipulasi — ini lebih merupakan persoalan filosofi daripada teknologi
Jika menjalankan Stable Diffusion dengan denoising strength rendah, watermark hampir hilang
Laporan kali ini katanya menawarkan metode yang lebih tidak merusak, tetapi melihat jejak tulisan AI di README, sulit untuk mempercayainya
SynthID terlihat cukup jelas pada beberapa gambar, terutama di area dengan banyak tepi atau teks
Saya penasaran apakah metode dalam repo ini bisa membuat bagian seperti itu terlihat lebih alami
Dari README, jejak Claude terlihat terlalu jelas
Dinding tabelnya tidak sejajar, dan struktur kalimatnya juga khas pola Claude
Meniru tabel ASCII tetapi lebar karakternya berbeda-beda sehingga barisnya tidak sejajar
Bahkan ada error off-by-one juga
Saya punya firasat bahwa pada 2037 pun kita masih akan melihat tabel Unicode yang tidak sejajar
Repo ini menguji performa penghapusan watermark hanya dengan detektor buatannya sendiri
Justru tidak divalidasi dengan aplikasi SynthID milik Google, jadi tidak banyak artinya
Dalam penjelasan proyek tertulis “jangan menipu dengan membuat konten hasil AI seolah-olah buatan manusia”, tetapi yang benar-benar didistribusikan justru alat CLI penghapus watermark
Nama pengaturan seperti “aggressive” dan “maximum” juga sangat terang-terangan
README tampak seperti output AI mentah yang tidak diedit, isinya berulang dan strukturnya juga berantakan
Ide dasarnya sendiri menarik (carrier yang bergantung pada resolusi, konsistensi fase antar gambar), tetapi packaging-nya merusak kepercayaan
Jika gambar di-downscale lalu di-upscale, watermark akan hilang
Sebenarnya memang tidak sesulit itu
Ada tulisan terkait di blog deepwalker.xyz