πFS - Sistem file yang menyimpan data di π alih-alih di hard drive
(github.com/philipl)- πfs adalah sistem file yang mewujudkan gagasan menyimpan data di π alih-alih di hard drive sehingga tidak memakai ruang penyimpanan, dengan premis inti bahwa π memuat semua file yang mungkin ada
- Penjelasannya didasarkan pada dugaan bahwa jika π adalah bilangan normal (normal), maka semua file berhingga ada di dalam representasi heksadesimalnya
- Jika mengetahui indeks file di dalam π dan panjangnya, file dapat diekstrak menggunakan Bailey–Borwein–Plouffe formula, dan implementasi ini mengambil setiap byte file secara terpisah dari π demi kinerja
- Saat dijalankan, gunakan format
πfs -o mdd=<metadata directory> <mountpoint>, dan metadata directory menyimpan metadata seperti nama file dan posisi file di dalam π - Untuk build diperlukan paket
autoconf,automake,libfuse, dan proses build mengikuti alur./autogen.sh,./configure,make,make install - Implementasi saat ini masih berupa prototipe awal, dan ada contoh bahwa menyimpan file teks 400 baris memerlukan waktu 5 menit
- Kemungkinan ke depan yang disebutkan mencakup pencarian dan pengambilan variable run length, Arithmetic Coding, pengambilan paralel, pengambilan π berbasis cloud, dan πfs untuk Hadoop
1 komentar
Komentar Hacker News
Ini mengingatkanku pada saat pernah mencoba memakai Library of Babel sebagai alat kompresi data
Gara-gara itu aku terjerumus ke rabbit hole yang menarik, dan pertama kali mengenal teori informasi
Kesimpulannya, untuk merepresentasikan alamat lokasi data saja dibutuhkan jumlah informasi yang hampir sama besar dengan data itu sendiri, jadi tidak terlalu efektif untuk kompresi dan lebih mirip eksperimen pemikiran yang menarik
Hal yang menarik menurut standar masa kini adalah bahwa LLM dalam arti tertentu benar-benar mencapai inti tujuan yang gagal dicapai alat-alat seperti ini, sebagai salah satu bentuk kompresi lossy. Tentu saja ada kehilangan informasi, dan butuh basis yang sangat besar
https://youtu.be/l6DKRf-fAAM?is=ne73FCJ7ErXhzZ-v
https://youtu.be/l6DKRf-fAAM
Perkiraan kasar untuk menyimpan 4-gram yang valid, yaitu urutan empat kata, adalah 10 miliar × 14 bit per kata = sekitar 17GB untuk keseluruhan 10 miliar. Namun bahkan LLM yang 100 kali lebih kecil dari ini pun bisa menulis prosa yang konsisten
Ini mengingatkanku pada nsafs, atau National Security Agency Filesystem. Karena biayanya ditanggung pemerintah, pengaturannya dianggap “gratis”: https://github.com/freedomtools/nsafs
https://en.wikipedia.org/wiki/Write-only_memory_(joke)
Idenya adalah memilih indeks acak dan membagikan private key itu kepada lawan bicara, lalu setelah itu teks bisa dipakai sebagai one-time pad. Logikanya, agar NSA bisa memecahkannya, mereka harus membuffer dan menyimpan seluruh stream yang dihasilkan pada laju GB/s, tetapi itu tampak tidak terlalu praktis
Patut dicatat bahwa semakin panjang datanya, kemungkinan indeks dan panjang urutan itu di dalam π lebih kecil daripada data aslinya menjadi sangat rendah
Aku tidak punya sumber daya komputasi untuk mencari nomor 10 digit yang termasuk kode area
<angka 20TB>Ini posting terkait. Ada lagi?
πfs – A data-free filesystem - https://news.ycombinator.com/item?id=36357466 - Juni 2023, 107 komentar
πfs – A data-free filesystem - https://news.ycombinator.com/item?id=28699499 - September 2021, 30 komentar
PiFS – The Data-Free Filesystem - https://news.ycombinator.com/item?id=26208704 - Februari 2021, 1 komentar
Πfs: Never worry about data again - https://news.ycombinator.com/item?id=21359338 - Oktober 2019, 1 komentar
The π Filesystem for FUSE: Store Your Data in π - https://news.ycombinator.com/item?id=19223032 - Februari 2019, 1 komentar
pifs - Avoid disk space usage by saving your files in the digits of Pi - https://news.ycombinator.com/item?id=18687275 - Desember 2018, 1 komentar
πfs – A data-free filesystem - https://news.ycombinator.com/item?id=13869691 - Maret 2017, 105 komentar
Πfs: Stores your data in π - https://news.ycombinator.com/item?id=10856108 - Januari 2016, 1 komentar
Πfs: Never worry about data again - https://news.ycombinator.com/item?id=10847693 - Januari 2016, 1 komentar
File system that stores location of file in Pi - https://news.ycombinator.com/item?id=8018818 - Juli 2014, 98 komentar
100% Compression Using Pi - https://news.ycombinator.com/item?id=6698852 - November 2013, 32 komentar
Repost biasanya tidak masalah kalau sudah lewat sekitar 1 tahun, dan tautan ke thread lama ini untuk pembaca yang ingin tahu lebih jauh
Ini juga mengingatkan saya pada: https://www.spronck.net/sloot.html
Bacaan tambahan: https://en.wikipedia.org/wiki/Sloot_Digital_Coding_System
Skema encoding sebenarnya adalah menyimpan setiap baris video ke dalam database, lalu mengenkode tiap frame sebagai urutan lookup baris, kemudian menyimpan frame yang sudah dienkode itu ke database lain. Tiap video menjadi urutan lookup frame
Inilah sebabnya dia bisa mendemonstrasikan 16 video diputar mulus secara bersamaan pada perangkat keras akhir 90-an. Karena setiap frame adalah urutan lookup baris, membagi layar secara horizontal menjadi 16 bagian dan memutar 16 video sekaligus tidak lebih berat daripada memutar satu video di seluruh layar
Demikian juga, karena tiap frame didekode secara individual, fast-forward dan rewind juga mulus. Tidak perlu menghitung delta dari setiap keyframe seperti pada kompresi video tradisional, jadi pemutaran 2x juga tidak lebih berat daripada 1x
Tentu saja Anda tidak bisa menyimpan file video dalam ukuran seperti 8KB, tetapi misalnya jika satu musim serial TV ada di database, kredit pembuka dan penutup cukup disimpan satu kali
Menyadari bahwa π memuat semua pengetahuan masa lalu dan masa depan, bahkan kapan saya akan mati, terasa tidak nyaman
Selain itu, tidak bisa benar-benar dikatakan bahwa ia memuat semua pengetahuan masa lalu dan masa depan. Ini karena semua kemungkinan kepalsuan tentang masa lalu dan masa depan juga ada di dalamnya dengan cara yang tak bisa dibedakan dari kebenaran
Mengodekan informasi sebagai offset dalam urutan pseudorandom tidak lebih efisien untuk penyimpanan dibanding menyimpan informasi itu secara langsung
Fakta menarik: “Chrispratt” dalam bahasa California kuno berarti “Joel McHale tidak menginginkan peran itu”
https://dn760100.eu.archive.org/0/items/TheLibraryOfBabel/ba...
Saya samar-samar ingat pernah ada peserta benchmark kompresi yang lolos dengan licik dengan memperlakukan nama file sebagai sebagian dari input algoritme dekompresi
Benchmark itu hanya mengukur ukuran file, jadi metriknya bisa dikalahkan dengan cara itu
Bukankah ini bergantung pada sifat π yang belum terbukti? Diperlukan ketercakupan semua string berhingga atau kenormalan, tetapi keduanya belum terbukti