2 poin oleh GN⁺ 2 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • OpenAI memperkuat model provenance berlapis yang menggabungkan kesesuaian C2PA, watermark SynthID, dan alat verifikasi publik untuk mengidentifikasi konten buatan AI
  • C2PA membawa konteks pembuatan dan penyuntingan konten bersama metadata dan tanda tangan kriptografis, tetapi dapat rusak dalam proses transformasi
  • SynthID dari Google DeepMind menambahkan watermark tak terlihat pada gambar yang dibuat melalui ChatGPT, Codex, dan OpenAI API untuk melengkapi kelemahan metadata
  • Pratinjau alat verifikasi publik membantu menilai apakah sebuah gambar dibuat oleh OpenAI dengan memeriksa Content Credentials dan SynthID pada gambar yang diunggah
  • Satu teknologi saja tidak cukup; ekosistem provenance hanya akan menjadi kuat bila menggabungkan standar bersama, watermark yang tahan lama, dan verifikasi publik

Memperkuat pendekatan provenance konten

  • OpenAI memperkuat model provenance berlapis untuk membangun kepercayaan online, dan ingin meningkatkan kemampuan identifikasi konten buatan AI berdasarkan standar terbuka serta kolaborasi lintas platform
  • Ada tiga perubahan utama
    • Mendukung agar alat dan platform lain lebih mudah mengenali sinyal provenance melalui kesesuaian C2PA
    • Bekerja sama dengan Google untuk menambahkan watermark SynthID pada gambar
    • Menyediakan pratinjau alat verifikasi publik agar masyarakat dapat memeriksa apakah gambar dibuat oleh OpenAI
  • Sinyal provenance memberikan konteks yang dibutuhkan untuk menilai dari mana konten berasal, bagaimana konten dibuat atau diedit, dan apakah sesuai dengan klaim yang menyertainya

Ekosistem kepercayaan melalui kesesuaian C2PA

  • Sejak 2024, OpenAI telah berpartisipasi dalam pengembangan dan adopsi standar provenance, serta mulai menambahkan Content Credentials pada gambar yang dihasilkan oleh DALL·E 3
  • Setelah itu, Content Credentials juga diterapkan pada ImageGen dan Sora
  • OpenAI bergabung dengan komite pengarah Coalition for Content Provenance and Authenticity (C2PA), organisasi lintas industri yang mendorong standar teknologi terbuka untuk provenance konten
  • C2PA adalah pendekatan yang membantu agar informasi terkait media dapat berpindah dengan aman bersama konten itu sendiri menggunakan metadata dan tanda tangan kriptografis
  • Informasi ini memberi konteks bagi jurnalis yang menilai provenance, platform yang mengambil keputusan terkait integritas, dan orang-orang yang ingin memahami konten online
  • OpenAI baru-baru ini menjadi produk generatif yang sesuai C2PA
  • Kesesuaian C2PA menjadi fondasi agar platform dapat membaca, mempertahankan, dan meneruskan informasi provenance yang melekat pada konten dengan cara yang tepercaya
  • Informasi provenance menjadi lebih bermakna ketika tetap dipertahankan melampaui platform tempat konten pertama kali dibuat, dan kepatuhan kesesuaian memungkinkan hal itu

Provenance gambar berlapis dengan SynthID

  • Metadata C2PA adalah fondasi untuk membawa informasi tentang dari mana konten berasal, bagaimana konten dibuat atau diedit, dan siapa yang menandatangani informasi tersebut
  • Metadata dapat dihapus, hilang saat proses unggah-unduh, atau rusak karena transformasi seperti perubahan format file, pengubahan ukuran, atau tangkapan layar
  • Untuk membuat informasi provenance lebih kuat, OpenAI mengadopsi watermark tak terlihat melalui SynthID milik Google DeepMind
  • Penerapannya dimulai terlebih dahulu pada gambar yang dibuat melalui ChatGPT, Codex, dan OpenAI API
  • SynthID berfungsi sebagai lapisan watermark tambahan yang melengkapi pendekatan berbasis metadata C2PA
  • OpenAI sebelumnya juga telah menguji pendekatan provenance dan watermark dalam lingkungan produksi nyata
    • Sora menggunakan watermark yang terlihat
    • Voice Engine menggunakan watermark audio
    • OpenAI terus menguji dan meneliti apakah akurasi serta keandalannya tetap terjaga seiring waktu
  • C2PA dan SynthID saling melengkapi kelemahan masing-masing
    • C2PA membantu menyertakan konteks rinci pada konten, tetapi metadata dapat dihapus atau rusak
    • SynthID membantu mempertahankan sinyal bahkan ketika metadata tidak bertahan, dan bisa tetap bertahan lebih lama terhadap transformasi seperti tangkapan layar
    • Metadata menyediakan lebih banyak informasi yang tidak dapat diberikan oleh watermark saja
  • Menggunakan kedua pendekatan bersama-sama membuat ketahanan informasi provenance konten lebih kuat dibandingkan jika masing-masing digunakan sendiri

Pratinjau alat verifikasi publik

  • OpenAI menyediakan alat verifikasi publik dalam versi pratinjau untuk membantu memeriksa apakah sebuah gambar dibuat melalui ChatGPT, OpenAI API, atau Codex
  • Alat ini memeriksa apakah gambar yang diunggah mengandung sinyal provenance seperti Content Credentials dan SynthID
  • Tujuannya adalah membantu pengguna memverifikasi dan menafsirkan informasi provenance konten dengan lebih mudah dengan menggabungkan beberapa sinyal
  • Alat verifikasi publik dapat mendeteksi watermark SynthID yang berasal dari OpenAI secara andal, dan bila metadata C2PA ditemukan, alat ini juga dapat menampilkannya
  • Karena tidak ada metode deteksi yang sempurna, alat ini tidak menarik kesimpulan yang pasti ketika deteksi gagal
    • Meski metadata atau watermark tidak terdeteksi, itu tidak berarti gambar tersebut pasti tidak dibuat dengan alat OpenAI
    • Dalam beberapa kasus, sinyal provenance dapat dihapus
  • Saat peluncuran, alat verifikasi dibatasi pada konten yang dibuat oleh OpenAI
  • Dalam beberapa bulan ke depan, tujuannya adalah mendukung upaya lintas industri yang memungkinkan verifikasi di seluruh platform
  • Seiring waktu, diharapkan alat ini juga akan mendukung lebih banyak jenis konten yang ditemui secara online

Tantangan ke depan

  • Satu teknologi provenance saja tidak cukup
  • Pendekatan provenance yang kuat harus menggabungkan standar bersama, sinyal watermark yang tahan lama, dan verifikasi publik
  • Melalui dukungan yang sudah ada untuk Content Credentials, kesesuaian C2PA, adopsi SynthID, dan pratinjau alat verifikasi publik, OpenAI ingin berkontribusi pada ekosistem provenance yang lebih interoperabel

1 komentar

 
GN⁺ 2 jam lalu
Komentar Hacker News
  • Kalau membuat gambar AI dengan latar belakang hitam, SynthID terlihat dengan mata pada monitor yang lumayan bagus. Hanya pola buram berulang, tidak ada yang istimewa.
    Saya berhasil menghapusnya dengan cukup baik dengan memask setiap piksel ke-2 lalu meregenerasi piksel yang hilang, lalu memberi offset 1 piksel dan kembali memask setiap piksel ke-2.
    Untuk pengisian piksel saya memakai model yang sudah ada, tetapi sebelum perubahan saya lebih dulu mengekspor depth map dan mengurangi noise agar piksel termask yang baru dihasilkan sesuai dengan konten asli. Hasilnya tidak 100% sempurna, tetapi dengan lebih banyak waktu dan model yang di-fine-tune untuk tujuan ini, sepertinya watermarking AI apa pun bisa dihapus tanpa banyak masalah.

    • Sulit dipercaya watermark yang hanya memuat keberadaan, seperti watermark 0,5-bit, bisa dihapus. Yang terlihat itu mungkin hanya umpan fungsional.
    • Apa tidak cukup dengan memperbesar atau mengompres gambar sedikit saja?
    • Menarik bahwa dengan lebih banyak waktu dan model yang di-fine-tune untuk kegunaan tertentu, watermarking AI apa pun bisa dihapus tanpa banyak masalah. Memakai AI melawan AI selalu menarik.
    • Jelas bisa diakali. Beberapa engineer kami juga sudah menangani ini sejak lama.
      https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
  • Informasi apa yang masuk ke metadata atau SynthID? Berapa bit yang bisa dienkode di SynthID?
    Apakah bisa dibuat semacam label nutrisi untuk konten sintetis? Misalnya 10% teks sintetis, 30% gambar sintetis.
    Realitas Anda hari ini 15% sintetis (75% perusahaan raksasa, 25% neocloud open-weights).

    • Makalah SynthID-Image Oktober 2025 [0] tampaknya menguji pemeriksaan flag atau payload 136-bit pada gambar 512x512, dan merupakan encoder-decoder yang melihat ketahanan watermark setelah berbagai transformasi.
      Versi yang benar-benar diterapkan kemungkinan cukup berbeda.
      [0]:https://arxiv.org/html/2510.09263v1
    • Bisa juga menyisipkan ID pengguna atau sidik jari per individu. Dulu printer sudah melakukan hal seperti itu, dan sekarang itu akan dengan mudah bisa diterapkan ke semua foto dan gambar yang dihasilkan.
    • Sepertinya itu tidak mungkin. Kalau potongan sintetis ditempel ke gambar asli, SynthID tidak akan bisa mengetahuinya.
  • Menarik bahwa SynthID tampak seperti sudah benar-benar dibobol, tetapi watermark baru OpenAI tampaknya belum [1].
    [1] https://github.com/wiltodelta/remove-ai-watermarks

  • Ini cuma aksi pura-pura.
    Dari sudut pandang orang yang membuat sesuatu dengan tool di berbagai media, saya akan menghindari tool seperti ini yang memasukkan metadata acak yang tidak saya pilih.
    Saat membuat tekstur untuk video game, kenapa saya harus menambahkan sisa-sisa DRM aneh seperti ini? Photoshop sudah ada sejak lama, kenapa dikecualikan?

    • Bukan berarti tidak berguna hanya karena tidak sempurna. Saya sudah melihat posting online tempat seseorang menjalankan gambar melalui pemeriksa SynthID Google dan membuktikan bahwa itu palsu.
      Photoshop bukan buatan Google atau OpenAI, dan ambang masuk untuk membuat gambar penipuan yang realistis dengan Photoshop jauh lebih tinggi daripada AI. Sudah ada juga teknik untuk mendeteksi, meski tidak sempurna, apakah pengeditan gambar tradisional dipakai.
    • Saya yakin orang bisa dengan mudah memikirkan beberapa hal yang membedakan Photoshop dari AI generatif.
    • Secara ketat DRM adalah manajemen hak digital, dan terkait kekayaan intelektual.
      SynthID baru bisa disebut DRM jika Google atau OpenAI mengklaim hak kekayaan intelektual atas gambar mereka, dan saya tidak tahu apakah itu legal.
    • Sebagai referensi: https://en.wikipedia.org/wiki/Printer_tracking_dots
    • Bagaimana kapasitas produksi disinformasi teoritis maksimum per menit hari ini dibandingkan Photoshop pada 2021?
  • Bagus. Orang bilang ini akan bisa dihapus, tapi saya belum melihat repositori yang menunjukkannya secara reproduktif.

    • Di Stable Diffusion, kekuatan denoise 10~15% sudah cukup.
      Saya mengujinya pada hari pertama Nano Banana Pro dirilis dan itu berhasil. Sekarang pun masih berhasil di Nano Banana 2.
      Saya tidak mempostingnya di mana pun karena saya dengan sombong berpikir mengatakannya secara publik akan membuat internet jadi lebih buruk. Tetapi kalau saya bisa memikirkannya pada hari pertama, tentu jutaan programmer lain juga bisa, jadi itu murni kesombongan.
      Hanya saja muncul artefak khas model SD, dan itu bisa dideteksi dengan cara lain. Atau bisa terlihat kalau diperbesar besar-besaran lalu diperiksa dengan teliti.
    • Sejak awal, sepertinya jauh lebih mudah memakai model lain.
    • Memang akan dihapus, tetapi banyak orang tidak akan melakukannya. Saya benar-benar pernah melihat disinformasi yang bisa dideteksi dengan SynthID.
  • Tepat di sebelah artikel ini ada artikel itu, ini sangat pas: https://news.ycombinator.com/item?id=48200569

  • Apakah seperti metadata pada mp3?
    Kalau mengambil screenshot gambar AI, apakah itu juga akan terlihat sebagai gambar AI? Saya penasaran apakah ini tersembunyi di dalam gambar, atau metadata.

    • Ini ada di dalam gambar, dan dirancang agar tetap bertahan meski melalui proses seperti itu.
  • Mula-mula mereka akan memverifikasi apakah foto berasal dari OpenAI, lalu memasukkan data pelanggan dan informasi lokasi.
    Pada akhirnya mereka akan sadar bahwa tidak ada yang ingin melihat foto atau teks buatan AI. Kalau begitu, tool ini akan gagal untuk publik dan hanya bekerja untuk pemerintah.

    • Satu-satunya kegunaan AI generatif yang fotorealistis tampaknya adalah penipuan. Video buatan AI sudah dipakai dalam iklan politik AS.
  • Bukankah watermark seperti ini mudah dihapus atau didistorsi? Sepertinya ini hanya membantu sampai orang jarang mengandalkannya sehingga tidak layak diakali.
    Kalau platform media sosial mulai melarang gambar dengan watermark seperti ini, sepertinya semuanya akan langsung dilucuti dalam semalam.

    • Tidak. Ini sangat tangguh terhadap transformasi yang mudah dilakukan. Tapi saya juga tidak menganggapnya mustahil.
    • Setahu saya belum ada satu pun repositori GitHub yang benar-benar menghapus watermark SynthID asli dari output Nano Banana 2/NBPro. Kebanyakan masih proyek riset yang belum menunjukkan hasil.
      Metode yang saya lihat sejauh ini hanyalah trik aneh memakai transparansi atau overlay gambar asli saat menggunakan fitur edit, atau meregenerasi gambar hasil NB dengan model difusi pada tingkat noise rendah, yang dalam kasus ini juga mengubah gambar aslinya.
    • Perlu definisi tentang “mudah”. Ada pendekatan berbasis analisis spektrum gambar, dan sekilas tampaknya bekerja.
      https://github.com/aloshdenny/reverse-SynthID
    • Ini dirilis beberapa tahun lalu dan tampaknya masih belum berhasil dipatahkan. Pada akhirnya pasti akan dipatahkan, tetapi kalau Anda harus menunggu 1~2 tahun setelah membuat deepfake sebelum bisa mengunggahnya ke Facebook, itu mungkin sudah cukup. Bahkan penundaan sebulan pun mungkin sudah cukup.
    • Berdasarkan penjelasan yang sangat detail, sepertinya metode menyuruh AI membuat ulang gambar dari nol bisa berhasil.
  • Ini tampak lebih rendah daripada C2PA yang merupakan standar publik nyata: https://contentauthenticity.org/