2 poin oleh GN⁺ 2024-05-15 | 1 komentar | Bagikan ke WhatsApp

Sir, there's a cat in your mirror dimension

  • Dulu pernah dibahas tentang domain frekuensi.

    • Ini adalah teknik untuk mengubah sinyal sehari-hari menjadi amplitudo dari gelombang penyusunnya.
    • Dasar yang paling umum adalah gelombang sinus dengan frekuensi yang meningkat.
    • Banyak bentuk gelombang lain juga dapat membentuk berbagai domain frekuensi.
  • Dua sifat penting dari transformasi domain frekuensi:

    • Reversibilitas: data asli dapat dipulihkan dari citra frekuensinya.
    • Simetri input-output: transformasi dapat dilakukan dua arah dengan operasi matematika yang sama.
  • Dalam praktiknya, perbedaan ini penting.

    • Terutama penting dalam kompresi.
    • Jika gambar diubah ke domain frekuensi dan presisi komponen frekuensi tinggi dikurangi, jumlah data ikut berkurang.
    • Gambar hasilnya tetap tampak sama secara visual.

Menggunakan MS Paint sebagai alat kompresi tercanggih

  • Gambar dalam domain frekuensi terlihat seperti noise yang menyebar.

    • Sebagian besar tidak penting secara visual.
    • Transformasi adalah tuas yang bergerak bolak-balik antara dua dimensi yang secara fungsional setara.
    • Muncul pertanyaan apakah dimensi cermin ini bisa dijadikan rumah dan sebagian data dipindahkan ke sana.
  • Untuk mengujinya, diambil foto kucing lalu dihitung bentuk domain frekuensinya dengan discrete cosine transform (DCT).

    • Kucing waktu, kucing frekuensi.
  • Foto wanita dari contoh sebelumnya digunakan, lalu pola "noise kucing" dari dimensi cermin ditumpangkan dan opasitasnya diturunkan.

    • Wanita waktu dan kucing frekuensi.
  • Proses komposit pasti menimbulkan loss.

    • Secara teori, jika gambar hasil komposit dihitung representasi domain frekuensinya dengan DCT, foto wanita akan terurai menjadi noise yang seragam.
    • "Noise kucing" yang disuntikkan akan menggumpal menjadi citra kucing yang bisa dikenali.
  • Dan memang begitulah yang terjadi.

    • Kucing frekuensi dan wanita waktu.
  • Untuk memastikannya sendiri, unduh gambar komposit lalu jalankan ini di MATLAB:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • Menariknya, kucing itu tetap bertahan meski dokumen host diubah ukurannya.

    • Upscaling akan men-tile gambar.
    • Downscaling akan memangkas gambar.
  • Lalu muncul rasa penasaran seberapa besar kompresi lossy merusak kucing itu.

    • Dampaknya lebih kecil dari perkiraan.
    • Pada pengaturan kualitas JPEG yang tinggi, gambarnya terlihat cukup baik.
    • Saat pengaturan kualitas diturunkan, kuadran kanan bawah mengalami kuantisasi berat.
    • Kekacauan kompresi JPEG dilihat dari domain frekuensi.
  • Visualisasi ini menunjukkan seberapa banyak informasi yang dihancurkan oleh algoritma JPEG.

    • Sebagian besar tidak kita sadari.
  • Sudah banyak contoh sebelumnya yang menggunakan spektrogram audio sebagai pesan tersembunyi.

    • Ada juga pembahasan tentang steganografi teks dengan memanfaatkan koefisien DCT JPEG.
    • Bukan berarti teknik ini sangat berguna, melainkan untuk menekankan bahwa domain frekuensi dan domain waktu terhubung dengan cara yang menarik.

Opini GN⁺

  1. Memahami transformasi domain frekuensi: transformasi domain frekuensi berperan penting dalam kompresi data dan pemrosesan sinyal. Dengan memahaminya, gambar atau audio dapat diproses lebih efisien.
  2. Pemanfaatan MATLAB: MATLAB adalah alat yang kuat untuk analisis dan visualisasi data. Artikel ini memperlihatkan contoh penggunaan praktis MATLAB.
  3. Batasan kompresi JPEG: batas kompresi JPEG bisa dipahami secara visual. Ini membantu mencari cara mengurangi ukuran file sambil menjaga kualitas gambar.
  4. Steganografi: steganografi yang memanfaatkan domain frekuensi adalah topik menarik terkait keamanan data. Dari sini dapat dipelajari cara menyampaikan pesan tersembunyi.
  5. Penerapan teknologi yang menyenangkan: artikel ini menunjukkan cara menerapkan teknologi secara kreatif dan menyenangkan. Ini dapat meningkatkan minat pada teknologi dan memunculkan ide-ide baru.

1 komentar

 
GN⁺ 2024-05-15
Opini Hacker News

Ringkasan kumpulan komentar Hacker News

  • Subjek foto dan energi spektral:

    • Pada sebagian besar foto, subjek yang dapat dikenali memiliki energi spektral yang terkonsentrasi di titik asal (kiri atas).
    • Subjek foto umumnya berada di tengah bingkai, sehingga meminimalkan interferensi antara data domain spasial dan domain frekuensi.
  • Dasar-dasar watermarking digital:

    • Teknik ini menjadi dasar bagi watermarking digital yang tangguh untuk sinyal seperti gambar atau audio.
    • Aplikasi utamanya adalah mendeteksi materi berhak cipta bahkan setelah sinyal diproses secara ekstensif.
  • Dualitas waktu-frekuensi pada transformasi Fourier:

    • Prinsip matematis transformasi Fourier bekerja sama tanpa memandang arah transformasinya.
    • Jika plot frekuensi kucing disisipkan ke dalam plot spasial perempuan, transformasi Fourier perempuan itu akan menampilkan kucing.
  • Permintaan verifikasi proses:

    • Sebuah foto diambil, kucing diubah ke domain frekuensi, lalu hasilnya dikompositkan ke dalam gambar visual perempuan.
    • Saat gambar komposit itu di-DCT lagi, kucing akan muncul.
  • Aplikasi steganografi:

    • Aplikasi steganografi yang menarik untuk menyembunyikan gambar ilegal.
    • Dengan mengubahnya ke domain frekuensi lalu mengompositkannya ke gambar lain, hanya orang yang tahu cara membalik prosesnya yang dapat melihat gambar tersebut.
  • Trik spektrogram audio Aphex Twin:

    • Mirip dengan trik seru ketika Aphex Twin membuat wajah aneh muncul di spektrogram audio sebuah trek.
  • Pentingnya posisi dalam DCT:

    • Jika kucing lebih terkonsentrasi di kiri atas, demo ini kemungkinan tidak akan bekerja dengan baik.
    • DCT memiliki banyak komponen frekuensi tinggi, sehingga menempatkan kucing di kiri atas besar kemungkinan akan membuatnya tenggelam.
  • Memahami kompresi gambar:

    • Menyadari bahwa domain frekuensi dapat digunakan untuk kompresi gambar.
    • Bertanya-tanya apakah sebagian besar algoritme kompresi gambar bekerja dengan membuang bagian yang sepi di domain frekuensi.
  • Metode DCT yang spesifik:

    • Tampaknya DCT diterapkan dengan cara yang berbeda dari tile 8x8 yang digunakan dalam JPEG.
    • Fungsi basis DCT 2D tampaknya tidak digunakan dalam kasus ini.
  • Encoding musik dan gambar:

    • Mirip dengan Aphex Twin dan Venetian Snares yang mengenkode gambar ke dalam suara.
    • Dengan alat tertentu, dapat dilihat bahwa frekuensinya menampilkan gambar kucing.