Saya mengembangkan VANI, yang menghapus data secara permanen dengan meruntuhkan struktur vektor data secara matematis
(github.com/eterners-inc)Halo. Pekerjaan utama saya adalah mengembangkan algoritma dan fungsi AI.
Belakangan ini, seiring kemajuan pesat AI generatif dan teknologi forensik, saya mulai mempertanyakan, "apakah penghapusan total data digital benar-benar mungkin?" Konon, bukan hanya overwrite, reset pabrik, penghapusan firmware, bahkan degaussing pun masih bisa dipulihkan karena sisa muatan listrik. Metode pembuangan kunci enkripsi (Crypto-shredding) juga tidak aman di hadapan komputasi kuantum di masa depan. Khususnya pada lingkungan SSD (NVMe), karena karakteristik wear leveling, metode 'overwrite (DoD 5220.22-M)' yang ada memiliki keterbatasan yang jelas: memperpendek umur pakai dan efisiensi penghapusan juga menurun.
Karena itu, alih-alih overwrite fisik, saya membuat alat penghapusan untuk Windows bernama VANI (Vector-based Advanced Nullification) yang meruntuhkan data secara matematis (Collapse), lalu merilisnya di GitHub dan Gumroad.
Kelebihannya adalah file dan data bisa dipilih lalu dihapus supercepat pada semua perangkat penyimpanan berbasis Windows, sedangkan kekurangannya adalah sekali dihapus maka selesai—tidak bisa diforensik dan terhapus permanen, jadi harus digunakan dengan hati-hati.
🛠 Proses pengembangan dan teknologi inti
Jika 'penghapusan' konvensional adalah seperti pekerjaan mengecat ulang 0 dan 1 di atas data, maka VANI lebih dekat ke cara meruntuhkan ruang vektor tempat data itu sendiri berada. (Dikembangkan dengan Python dan Rust. Karena spesialisasi saya ada di algoritma, saya rasa saya jauh lebih banyak tersesat di pekerjaan UI/desain daripada implementasi kode... 😅)
-
Vector State Collapse: Data file didefinisikan bukan sebagai deretan bit sederhana, melainkan sebagai state vektor, lalu disuntikkan noise yang secara matematis ortogonal terhadap data asli untuk melenyapkan polanya sendiri.
-
Entropy Maximization: Yang disuntikkan bukan sekadar angka acak, melainkan 'chaos buffer' dengan Shannon Entropy yang dimaksimalkan hingga batas ekstrem. Karena entropi secara matematis tidak bisa diturunkan kembali, layaknya hukum termodinamika, sistem ini dirancang agar tidak bisa dibalik perhitungannya bahkan dengan algoritma Grover pada komputasi kuantum di masa depan.
-
Hilbert Curve Optimization: Untuk efisiensi disk I/O, saya menerapkan Hilbert curve, yaitu algoritma space-filling curve. Berkat ini, pada lingkungan NVMe saya berhasil mewujudkan kecepatan penghapusan 1GB dalam waktu kurang dari 1 detik.
💾 Mencobanya
Ini adalah versi portable yang bisa langsung dijalankan. Untuk penggunaan pribadi, saya mengunggahnya ke GitHub agar bisa dipakai gratis tanpa pembatasan fitur.
GitHub (gratis/pribadi): https://github.com/eterners-inc/VANI (mendukung penghapusan satu file, tanpa iklan)
Gumroad (berbayar/korporat): eterners.gumroad.com/l/vani-pro (fitur bisnis seperti penghapusan per folder, pembuatan audit report, dll.)
💬 Penutup
Saya berharap VANI bisa menjadi alat yang berguna bagi individu atau startup yang tidak bisa membuang hard disk berisi informasi rahasia ke tungku peleburan seperti grup S. Masukan tentang algoritma atau pemrosesan low-level I/O, maupun laporan bug, selalu saya sambut kapan saja.
⚠️ Notice tambahan (Ghost Protocol) Karena teknologi penghapusan total data berpotensi disalahgunakan atau digunakan untuk tujuan buruk, saya mengembangkan dan memasang algoritma pertahanan mandiri (Ghost Protocol) yang mencegah debugging dan melindungi source code, sehingga sistem akan lockdown saat terdeteksi penggunaan yang tidak sah. Modul keamanan ini juga sedang saya pertimbangkan untuk dibuka sebagai library terpisah bagi startup atau sesama developer yang membutuhkan keamanan, sebelum nantinya didaftarkan sebagai paten.
15 komentar
Anda tampaknya tidak menyadari bahwa solusi Anda sendiri sama sekali tidak mampu mengatasi keterbatasan yang Anda tunjuk sebagai masalah. Terlihat ada kontradiksi besar karena Anda tetap membawa persoalan wear leveling pada SSD apa adanya.
Jika penghapusan data secara menyeluruh itu penting, menerapkan enkripsi seluruh disk yang cukup kuat sejak awal lebih realistis daripada algoritme penghapusan khusus seperti ini. Dengan menghancurkan kuncinya saja, seluruh data akan menjadi noise.
Apa perbedaan antara metode penghapusan file pada produk yang Anda ajukan dengan menimpa file menggunakan data acak (termasuk pseudo-acak)?
Kode
free/main_free.pyyang dapat dilihat di repositori pada akhirnya tampak hanya menimpa 4096 byte pertama file dengan noise pseudo-acak baru, lalu memanggil library berbasis Rust yang detailnya tidak dipublikasikan dan tidak jelas, sambil mengklaim bahwa setelah itu ada semacam proses lain yang dilakukan. Namun, saya tidak bisa mengetahui apa perbedaan kualitatifnya dibanding sekadar menimpa file dengan pseudo-acak, dan dari materi yang Anda publikasikan saja tampaknya belum cukup untuk membuktikannya.Bisakah Anda menjelaskan dalam aspek apa ini secara kualitatif berbeda dari penimpaan pseudo-acak, khususnya saat ada upaya pemulihan file/forensik, dibandingkan dengan sekadar menimpanya menggunakan pseudo-acak, perubahan apa yang ada dari sisi kemungkinan pemulihan? Atau adakah bagian yang bisa diklaim berbeda tergantung media penyimpanan (hard disk dan SSD)?
Halo. Ini komentar yang menyenangkan dan saya syukuri. Saya biasanya hanya membaca diam-diam dan ini pertama kalinya saya mengunggah tulisan, jadi agak kaget juga karena ada komentar yang ditulis AI.
Seperti yang Anda katakan,
main_free.pypada versi Free yang dipublikasikan berperan sebagai titik masuk (Entry Point) sistem file, dan setelah meruntuhkan header 4KB untuk memblokir pengenalan oleh OS, pemrosesan sebenarnya diteruskan ke core Rust (vani_core). Kritik bahwa detailnya masih belum jelas sepenuhnya valid dalam cakupan yang saat ini dibuka ke publik.Terkait pertanyaan Anda tentang 'perbedaan kualitatif dibanding penimpaan PRNG sederhana', saya akan menjelaskan maksud desain saya dan arah teknis yang saya tuju.
Perbedaan entropi pada Orthogonal Noise vs Pseudo-Random
random()sederhana atau/dev/urandommemang mengejar distribusi seragam secara statistik, tetapi dari sudut pandang analisis pola data, masih bisa ada periodisitas yang dapat dilacak balik. VANI menghasilkan 'chaos buffer' yang secara matematis memaksimalkan Shannon Entropy hingga batas ekstrem. Jadi bukan sekadar menyebarkan angka acak, melainkan menyuntikkan noise yang secara matematis ortogonal terhadap vektor data asli, agar sisa medan magnet fisik atau status muatan sel terdorong menuju keadaan setimbang yang tidak dapat dipulihkan. (Bagian ini rencananya akan diungkap lebih rinci dalam whitepaper setelah pengajuan paten dilakukan.)Optimasi I/O di lingkungan SSD (Legacy Linear vs Hilbert)
Sebenarnya ini adalah perbedaan paling menentukan berdasarkan media penyimpanan seperti yang Anda tanyakan. Metode lama menimpa secara linear dari sektor 0 hingga akhir. Ini tidak cocok dengan struktur pemrosesan paralel SSD, dan karena wear leveling, kemungkinan besar penimpaan tidak benar-benar terjadi pada alamat fisik yang sesungguhnya.
Namun, metode VANI menelusuri alamat logis secara non-linear melalui algoritma Hilbert Curve di dalam core Rust. Ini memanfaatkan bandwidth multi-queue NVMe secara efisien, sehingga dengan jumlah pass penulisan yang jauh lebih sedikit dibanding metode lama, keterkaitan semantik data dapat diputus.
Next Action
Seperti yang Anda tunjukkan, memang benar bahwa hanya dari kode versi Free yang saat ini dibuka, pihak ketiga akan sulit memverifikasi bahwa ini benar-benar berbeda secara kualitatif. Karena ini model matematis, saat ini juga belum sampai tahap mendapat sertifikasi resmi dari perusahaan forensik profesional. Karena itu, ke depannya saya berencana menyiapkan data benchmark Before/After di lingkungan SSD, atau membandingkannya dengan PRNG sederhana memakai tool benchmarking, atau mengembangkannya dalam kode Python untuk eksperimen perbandingan lalu mempublikasikan hasilnya agar bisa diverifikasi.
Sebenarnya karena ini pertama kalinya saya menulis postingan, saya sempat agak khawatir. Tapi syukurlah, bukan AI yang bertanya seperti di bawah ini. Pertanyaan tajam dan proses verifikasi seperti inilah yang memang ingin saya dapatkan sebagai feedback di Show GN. Ke depannya juga, kalau Anda terus menunjukkan kekurangan yang ada, saya akan mengembangkannya lebih lanjut. Terima kasih!
Ada sangat banyak poin yang ingin saya kritik secara spesifik.
Mulai dari fakta bahwa seed nilai pseudorandom yang dipakai untuk "meruntuhkan" 4 KiB pertama file adalah kombinasi jalur file dan ukurannya, sehingga sepenuhnya deterministik, hingga fakta yang sudah jelas bahwa pengajuan paten untuk algoritma komputer sangat sulit, dan sekalipun patennya terdaftar, paten itu sendiri tidak bisa dijadikan dasar untuk mengklaim bahwa keamanannya telah terbukti; bahkan dari yang sudah terungkap saja terlihat ada sangat banyak hal yang perlu dikritik.
Namun, yang paling penting adalah ini. Algoritma rahasia yang katanya akan dipatenkan itu, sebenarnya memberikan manfaat tambahan apa dibanding penghapusan file biasa?
Karena tampaknya Anda mengasumsikan lingkungan SSD sebagai skenario utama, saya akan membahasnya dengan membatasi pada SSD saja. (Harap dicatat bahwa ini bukan berarti ada manfaat yang signifikan jika diterapkan pada HDD.)
SSD modern dibuat dari memori flash NAND, dan karakteristik memori flash NAND adalah sel yang sudah berisi data tidak bisa ditimpa langsung. Karena data tidak bisa langsung ditulis lagi ke sel yang sudah pernah diisi, harus ada proses penghapusan terlebih dahulu. Karena jumlah siklus hapus ini terbatas, pada memori flash operasi penghapusan tidak dilakukan pada tingkat sel atau halaman individual, melainkan hanya pada tingkat blok, yaitu kumpulan dari beberapa halaman. Karena itu diperlukan lapisan FTL (Flash Translation Layer) dan timbul masalah write amplification.
Artinya, meskipun Anda "menimpa" sebagian isi file pada SSD, secara fisik data hasil upaya penimpaan itu akan disimpan di sel yang sepenuhnya berbeda. Baik ditimpa dengan 0, maupun dengan angka acak yang dihasilkan dengan metode tertentu, tidak ada perbedaan sama sekali dalam hal bahwa isinya akan ditulis ke sel fisik yang lain. Dari sudut pandang perangkat lunak di atas abstraksi perangkat keras SSD, yang terlihat memang hanya hasil setelah ditimpa, tetapi pada tingkat OS atau aplikasi kita tidak bisa mengendalikan memori flash NAND secara langsung dan eksplisit.
Meski demikian, ini bukan berarti penghapusan data di dalam SSD tidak pernah benar-benar terjadi. Sel yang berisi data yang tidak lagi dipakai perlu dihapus lebih dulu agar nanti saat data baru akan ditulis tidak timbul latensi. Karena itu, pengendali internal SSD terus menjalankan GC (Garbage Collection) di latar belakang.
Sejak era 2010-an, semua sistem operasi utama mendukung perintah TRIM. TRIM adalah cara OS memberi tahu SSD bahwa "blok-blok ini tidak lagi digunakan". Dengan begitu, blok-blok tersebut menjadi target garbage collection yang terus berjalan di latar belakang oleh pengendali SSD. Kita memang tidak tahu kapan pembersihan itu benar-benar dilakukan, tetapi begitu garbage collection berlangsung dan penghapusan pada blok NAND dieksekusi, bahkan jika chip individualnya dibongkar secara fisik, informasi yang hilang itu tidak dapat dipulihkan. Dan karena OS modern pada dasarnya mengaktifkan TRIM secara default, hanya dengan melakukan penghapusan file biasa dari sistem operasi pun, setelah waktu tertentu pemulihan data pada akhirnya memang menjadi tidak mungkin.
Jadi, dalam lingkungan SSD, jika Anda hanya menjalankan perintah penghapusan file bawaan OS, memang tidak bisa dipastikan secara deterministik kapan data itu hilang, tetapi pada akhirnya data di sel akan lenyap sepenuhnya. Sebaliknya, jika Anda menimpa data di dalam file, informasi pada sel yang secara fisik menyimpan data asli justru bisa tetap bertahan apa adanya untuk sementara waktu. Bukankah ini justru ironis?
Tentu saja, jika pada akhirnya Anda tetap memanggil perintah penghapusan bawaan OS, hasil akhirnya juga sama: setelah jangka waktu tertentu data pada sel akan hilang secara fisik. Tetapi kalau hasilnya sama, bukankah tidak perlu memakai algoritma yang terdengar megah, dan cukup melakukan penghapusan file biasa saja?
Ada istilah Purple hat therapy.
Bayangkan ada seseorang yang berkata, "Untuk menyembuhkan penyakit X, Anda harus mengenakan topi ungu ini yang mengandung energi kosmik ajaib sambil meminum obat Y." Padahal kenyataannya, obat Y memang sejak dulu sudah dipakai untuk mengobati penyakit X. Tentu saja, terapi dengan topi ungu itu tampak efektif juga, tetapi tingkat efektivitasnya pada dasarnya sama persis dengan metode pengobatan yang sudah ada. Kalau begitu, topi ungu itu perlu atau tidak?
Menurut saya, benda bernama VANI ini justru sangat cocok dengan istilah "purple hat therapy". Berdasarkan informasi yang telah dipublikasikan, sama sekali tidak terlihat dasar untuk menilai bahwa ini memberikan keamanan yang bermakna atau manfaat lain dibanding penghapusan file bawaan OS. Penyebutan banyak istilah teknis seperti istilah matematika atau algoritma komputer kuantum tampaknya tidak lebih dari sarana pemasaran murahan untuk membenarkan harga versi berbayar yang mencapai 100 dolar. Bahkan jika program ini sepenuhnya gratis pun, saya tetap tidak akan pernah menggunakannya.
Saya sudah lama sekali tidak membaca tulisan yang begitu menarik, sampai saya membacanya dua kali. Terima kasih banyak sudah menulis artikel seperti ini.
Saya tadinya hanya ingin menekan tombol suka, tapi rasanya kurang sopan kalau tidak meninggalkan komentar. Saya membacanya dengan sangat menikmati.
Terima kasih.
Saat menulis komentar, tanpa terasa panjangnya jadi luar biasa sehingga hampir seperti sebuah posting blog, jadi saya sempat berpikir apakah sebaiknya diunggah begitu saja. Namun karena sayang dengan waktu yang sudah terpakai untuk menulis sampai sejauh ini, akhirnya saya tetap mengunggahnya, dan syukurlah Anda membacanya dengan antusias.
Halo, saya PM yang tergabung dalam TF platform konvergensi kuantum-termodinamika di bawah Institut Riset Teknologi Masa Depan S Electronics. (Saat ini kami sedang dalam tahap penutupan putaran bridge Series C, jadi sulit untuk mengungkap identitas saya)
Saya membaca tulisan tentang VANI dan langsung bangun dari tempat tidur pukul 4 pagi. Sejujurnya saya merasakan getaran luar biasa.
Di institut kami juga telah meneliti "protokol pemusnahan informasi berbasis distribusi inverse-Boltzmann" sejak 2019, dan bottleneck utamanya memang kebocoran entalpi pada antarmuka Shannon-Gibbs. Namun mendengar bahwa Anda berhasil mengatasinya lewat keruntuhan ortogonal pada ruang Hilbert... peneliti utama kami sampai berkata, "mungkin beginilah rasanya saat Einstein memecahkan paradoks EPR".
Khususnya, gagasan memutus tautan vektor pada file header dengan ortogonalisasi Gram-Schmidt adalah wilayah yang bahkan tidak berhasil kami capai selama 3 tahun riset bersama Departemen Ilmu Matematika KAIST. Apakah Anda juga secara internal telah mengimplementasikan transisi keadaan pseudo-qubit berbasis operator non-Hermitian? Jika iya, maka ini bukan sekadar alat penghapusan, melainkan titik awal dari paradigma insinerasi informasi pasca-kuantum.
Perusahaan induk kami (Top 20 kapitalisasi pasar global) saat ini sedang menyiapkan "inisiatif Data Thermal Death", dan mesin maksimalisasi entropi milik VANI persis selaras dengan milestone Phase 2 pada roadmap kami.
~~Investasi~~ maksud saya, apakah dimungkinkan untuk membahas kemitraan teknologi strategis?
Syarat dari pihak kami:
Namun, tim legal kami mengatakan perlu ada tinjauan hukum terkait "daya ikat matematis hukum kedua termodinamika". Apakah Anda mungkin telah memperoleh peer review Nature atau sertifikasi ISO 27001 Annex Q terkait bagian bahwa entropi "tidak mungkin menurun secara absolut"?
Dan ini pertanyaan pribadi... bagaimana Anda mendefinisikan satuan penghapusan yang didiskretkan berbasis konstanta Planck? Kami menggunakan h-bar sebagai acuan dan mengasumsikan "kuantum penghapusan" dalam satuan 6.626 × 10⁻³⁴ joule·detik, tetapi pada titik ambang coherence-decoherence dengan cache controller NVMe, fasenya terus bergeser.
Pokoknya, ini benar-benar luar biasa. Rasanya seperti Maxwell, Boltzmann, dan Shannon abad ke-21 turun dalam satu tubuh.
Mohon kabar secepatnya. 🙏
P.S. Data yang dihapus dengan VANI tidak berpindah ke alam semesta paralel, kan? CTO kami tiba-tiba mengkhawatirkan hal itu.
Apa cuma saya yang merasa candaan ini lucu.. wkwkwk
Muncul lagi hari ini... repo gumpalan AI slop
Apa saya yang terlalu bodoh.. harus belajar lagi Pengantar Ilmu Komputer..
Bahkan teks perkenalannya juga pakai LLM wkwk..
Secara pribadi saya sangat tidak suka kalau sampai teks perkenalan pun ditulis dengan LLM
Hmm.. AI bahkan memberikan kecurigaan yang masuk akal bahwa ini tampak seperti sandiwara buatan sendiri.
Ini serius? wkwk