Mengapa filesystem menjadi sorotan
(madalitso.me)- Dalam ekosistem AI agent belakangan ini, filesystem kembali menjadi sorotan dan muncul sebagai sarana pengelolaan konteks persisten yang berbeda dari database
- Context window pada LLM lebih mirip papan tulis yang terus terhapus daripada memori persisten, dan filesystem adalah sarana penyimpanan permanen paling sederhana untuk mengatasinya
- Claude Code, Cursor, dan lainnya mewujudkan memori jangka panjang melalui penyimpanan konteks berbasis file, dengan file seperti
CLAUDE.mddanaboutme.mdberperan menyimpan identitas agen dan informasi lingkungan - Pengelolaan konteks berbasis filesystem muncul sebagai topik utama, dengan perusahaan besar seperti LlamaIndex, LangChain, Oracle, dan Archil berturut-turut merilis tulisan dan produk terkait
- Di tengah menjamurnya file konteks agen seperti
CLAUDE.md,AGENTS.md, dan.cursorrules, format Agent Skills (SKILL.md) dari Anthropic diadopsi oleh Microsoft, OpenAI, GitHub, Cursor, dan lainnya sehingga memperoleh interoperabilitas - Menurut riset ETH Zürich, file konteks justru dapat menurunkan tingkat keberhasilan tugas dan meningkatkan biaya inferensi lebih dari 20%, sehingga sebaiknya hanya memuat kebutuhan minimum
- File tidak terikat pada aplikasi tertentu, dan di era AI agent kini menempatkan diri sebagai antarmuka terbuka yang memungkinkan perpindahan antaralat, penggabungan workflow, dan kesinambungan
Everyone is talking about files : semua orang sedang membicarakan file
- LlamaIndex merilis "Files Are All You Need", dan LangChain membahas bagaimana agen dapat memanfaatkan filesystem untuk context engineering
- Oracle (ya, Oracle itu!) memublikasikan tulisan perbandingan filesystem dan database untuk manajemen memori agen AI yang efektif, sementara Dan Abramov mengusulkan social filesystem berbasis AT Protocol
- Archil sedang membangun cloud volume karena agen menginginkan filesystem POSIX
- Jerry Liu dari LlamaIndex berpendapat bahwa alih-alih "satu agen dengan ratusan alat", filesystem dan 5~10 alat saja bisa lebih serbaguna daripada agen dengan lebih dari 100 alat MCP
- Karpathy menunjukkan bahwa alasan Claude Code bekerja adalah karena ia berjalan langsung di atas komputer, lingkungan, data, dan konteks pengguna, serta menilai fokus OpenAI pada deployment container cloud sebagai arah yang keliru
- Saat ini coding agent mencakup sebagian besar kasus penggunaan AI yang benar-benar nyata, dan Anthropic disebut mendekati profitabilitas karena alat CLI Claude Code mendorong porsi besar pendapatannya
Context window bukan memori
- Memori manusia mencakup penyimpanan jangka panjang, pemanggilan kembali secara selektif, dan kemampuan melupakan informasi yang tidak perlu, tetapi context window pada LLM lebih dekat ke papan tulis yang terus terhapus
- Saat menggunakan Claude Code, ketika notifikasi "context left until auto-compact" mendekat, konteks yang telah dikumpulkan agen—seperti codebase, preferensi, dan keputusan—akan dikompresi atau hilang
- Filesystem menyelesaikan hal ini dengan cara paling sederhana: tulis catatan ke file, lalu baca kembali saat diperlukan
CLAUDE.mdmenyediakan konteks persisten tentang proyek- Cursor menyimpan riwayat chat lama sebagai file yang dapat ditelusuri
- File
aboutme.mdberperan sebagai deskriptor identitas portabel yang memuat preferensi, keterampilan, dan gaya kerja, serta dapat berpindah antarapp tanpa orkestrasi API
Riset ETH Zürich: paradoks file konteks
- Makalah terbaru dari ETH Zürich mengevaluasi apakah file konteks tingkat repositori benar-benar membantu agen coding menyelesaikan tugas
- Hasilnya berlawanan dengan intuisi: di berbagai agen dan model, file konteks justru menurunkan tingkat keberhasilan tugas, sementara biaya inferensi naik lebih dari 20%
- Agen yang diberi file konteks menjelajah lebih luas, menjalankan lebih banyak pengujian, dan menelusuri lebih banyak file, tetapi justru terlambat mencapai kode yang benar-benar perlu diperbaiki
- File itu bekerja seperti checklist yang diikuti agen terlalu serius
- Kesimpulan makalah tersebut bukan "jangan gunakan file konteks", melainkan persyaratan yang tidak perlu membuat tugas makin sulit, sehingga file konteks seharusnya hanya menjelaskan kebutuhan minimum
- Masalahnya bukan pada lapisan persisten filesystem itu sendiri, melainkan praktik menulis
CLAUDE.mdseperti dokumen onboarding sepanjang 2.000 kata
Format file adalah API — tetapi file yang mana?
- Saat ini
CLAUDE.md,AGENTS.md,copilot-instructions.md, dan.cursorruleshidup berdampingan; ada kesepakatan bahwa agen membutuhkan konteks persisten berbasis filesystem, tetapi nama file dan format isinya belum disepakati - Dalam tulisan Dan Abramov tentang social filesystem, desain intinya adalah: AT Protocol memperlakukan data pengguna sebagai file dalam repositori pribadi, dan aplikasi tidak perlu sepakat tentang apa itu "post" karena benturan dicegah lewat namespace berbasis nama domain
- Database semua aplikasi menjadi data turunan, yaitu cached materialized view dari folder semua pengguna
- Anthropic mengumumkan Agent Skills sebagai standar terbuka: format
SKILL.mddiadopsi oleh Microsoft, OpenAI, Atlassian, GitHub, dan Cursor- Skill yang ditulis untuk Claude Code juga berjalan di Codex dan Copilot — format file adalah API
- NanoClaw adalah framework asisten AI pribadi yang ringan dan mengadopsi model "skill alih-alih fitur"
- Jika membutuhkan dukungan Telegram, bukan modul Telegram melainkan skill
/add-telegram(file Markdown) yang mengajarkan Claude Code cara mengintegrasikannya - Karena skill adalah file, ia portabel, dapat diaudit, dan dapat dikombinasikan — tanpa perlu server MCP atau marketplace plugin
- Jika membutuhkan dukungan Telegram, bukan modul Telegram melainkan skill
- Inilah interoperabilitas tanpa koordinasi: jika dua aplikasi bisa membaca Markdown, keduanya bisa berbagi konteks; jika keduanya memahami format
SKILL.md, keduanya bisa berbagi fungsi; tanpa kontrak kemitraan atau rapat lembaga standardisasi, format file itu sendiri menjalankan peran koordinasi
Perpindahan bottleneck
- Arsitektur data tradisional dirancang dengan asumsi bahwa storage adalah bottleneck, tetapi ketika kemampuan pemrosesan melampaui storage I/O, paradigma pun bergeser ke pemisahan storage dan compute (S3 + cluster compute sementara)
- Fenomena serupa terjadi pada AI agent: bottleneck bukan performa model atau compute, melainkan konteks
- Model sudah cukup pintar, tetapi pelupa
- Filesystem adalah cara paling efektif mengelola konteks persisten tepat di titik tempat agen berjalan (mesin pengembang, lingkungan, dan data yang sudah ada di sana)
Filesystem pada dasarnya sudah berupa graf
- Di Twitter ada komentar bahwa orang yang memakai filesystem sambil mengatakan agen tidak butuh graf sebenarnya sedang menyangkal bahwa mereka sudah memakai graf
- Filesystem terdiri dari direktori, subdirektori, dan file dalam struktur pohon, yaitu directed acyclic graph (DAG)
- Saat agen menjalankan
ls,grep, membaca file, dan mengikuti referensi, ia sebenarnya sudah menelusuri graf
- Richmond dalam tulisan Oracle memberikan pembedaan paling tajam: filesystem menang sebagai antarmuka, database menang sebagai lapisan dasar
- Ketika kebutuhan seperti akses serentak, semantic search skala besar, deduplikasi, dan pembobotan recency muncul, pada akhirnya orang akan membangun indeks sendiri, yang pada dasarnya adalah database
- Antarmuka file kuat karena universal dan sudah dipahami LLM, sementara lapisan dasar berbasis database kuat karena menyediakan jaminan yang dibutuhkan dalam operasi nyata
- Masa depan bukan file versus database, melainkan struktur di mana file menjadi antarmuka interaksi manusia dan agen, sementara lapisan dasar di bawahnya disesuaikan dengan use case
Ini adalah redefinisi personal computing
- Filesystem dapat mendefinisikan ulang makna personal computing di era AI
- Data, konteks, preferensi, skill, dan memori hadir dalam format yang dimiliki pengguna, dapat dibaca agen mana pun, dan tidak terkunci pada aplikasi tertentu
aboutme.mdbekerja baik di OpenClaw/NanoClaw hari ini maupun di alat baru besok- File skill dapat dipindahkan, dan konteks proyek tetap bertahan melampaui alat tertentu
- Ini adalah bentuk yang sejak awal dituju personal computing sebelum semuanya berpindah ke aplikasi SaaS tertutup dan database proprietari
- File adalah protokol terbuka yang asli, dan ketika AI agent menjadi antarmuka utama komputasi, file menjadi lapisan interoperabilitas yang memungkinkan perpindahan alat, penggabungan workflow, dan kesinambungan antar aplikasi tanpa izin siapa pun
- Meski begitu, ada sisi idealistis: sejarah format terbuka dipenuhi standar yang menang di atas kertas tetapi gagal dalam praktik
- Perusahaan memiliki insentif kuat untuk membuat file konteks mereka sedikit berbeda demi mempertahankan switching cost
- Fakta bahwa
CLAUDE.md,AGENTS.md, dan.cursorruleshidup berdampingan alih-alih menjadi satu format universal menunjukkan bahwa fragmentasi adalah default - Makalah ETH Zürich mengingatkan bahwa sekalipun formatnya ada, menulis file konteks yang baik tetap sulit, dan file konteks yang buruk bisa lebih buruk daripada tidak ada sama sekali
- Pesan inti Dan Abramov:
Memori, pemikiran, dan desain kita harus bertahan lebih lama daripada perangkat lunak yang membuatnya
- Ini bukan klaim teknis melainkan persoalan nilai, dan filesystem cocok menjalankan peran ini bukan karena ia teknologi terbaik, tetapi karena ia sudah menjadi satu-satunya teknologi yang dimiliki pengguna
1 komentar
Komentar Hacker News
File adalah bentuk kebebasan yang mendasar karena memungkinkan pengguna benar-benar memiliki datanya sendiri
Ini memungkinkan kedaulatan atas kerahasiaan, integritas, dan ketersediaan
Sebagai pilar utama kebebasan digital, ini seharusnya dipandang setara dengan lisensi FOSS
Bahasa alami itu sendiri bisa berada di dalam file, dan keterbacaan menjadi spesifikasi
Siapa pun yang bisa menulis dengan mudah dibaca manusia dapat menulis ke file, dan file itu bisa dijalankan langsung seperti REPL
Data jadi terikat ke aplikasi dan tidak bisa eksis secara mandiri, serta sulit diimpor/diekspor
Untuk mengatasi masalah ini, saya sedang membuat alat yang mengekstrak data dari backup menjadi unit file granular lalu memindahkannya ke perpustakaan digital pribadi
Data yang immutable cukup diarsipkan, tetapi tantangan terbesarnya adalah membuat data yang bisa diubah kembali menjadi bentuk ‘hidup’ yang dapat diedit di aplikasi
Perubahan sementara dan berbagi jadi mudah, dan makna dari konfigurasi didefinisikan dengan jelas
Saya tidak suka bagaimana Windows memperlakukan file seperti warga kelas tiga
Saya berpikir sama dari sudut pandang SaaS
Semakin kode bersifat sementara dan spesifik domain, semakin data (file) harus standar dan stabil sampai terasa membosankan
Format yang hanya bisa dibaca aplikasi tertentu adalah utang teknis, dan pada akhirnya merusak proyek
Alasan file JPEG dari 1995 masih bisa dibuka sampai sekarang adalah karena ia tidak bergantung pada perangkat lunak tertentu
Ini adalah pendekatan yang sudah berkali-kali terbukti benar
Lapisan abstraksi seperti Google Photos atau Immich hanyalah soal kenyamanan; intinya tetap file
Di pekerjaan juga saya mengelola riset dan dokumen dengan file markdown dan csv
tautan proyek elodie
Saat pindah platform, seluruh riwayat edit hilang
Fitur undo memang nyaman, tetapi saya berharap perubahan seperti ini distandardisasi agar portabel
Saya ingin menyebut Plan 9 dari Bell Labs
Plan 9 from Bell Labs
Saya bertanya ke Claude tentang riset pendahuluan, dan ia menyebut Plan 9; itulah tepatnya konsep yang kita butuhkan sekarang
Filosofi meminimalkan hak akses agen sama dengan model keamanan perusahaan
Hanya saja Plan 9 hadir terlalu dini
Ini kembali mengingatkan saya bahwa Plan 9 dan UNIX memang benar
Antarmuka paling kuat adalah file teks di atas file system
Kini saatnya membuat 9p2026 lagi
Hanya saja, beberapa konsep dasar dalam tulisan itu keliru — file system bukan pohon, melainkan graf yang bisa bersiklus
Ini sangat relate buat saya juga
Selama setahun terakhir saya telah memindahkan data pribadi dari belasan SaaS ke satu struktur direktori
File system yang tertata sudah cukup untuk pengguna tunggal, dan menghilangkan fragmentasi data
Ke depan, sepertinya akan muncul database baru yang mendukung penulisan multi-pengguna yang aman tanpa membuat file system jadi opak
Rasanya mirip dengan peran QMD untuk pencarian
Saat ini pemanfaatan AI masih berada di fase belum matang
Sistem produksi akan berjalan di atas struktur data yang konsisten dan dapat diskalakan, tetapi agen yang membangunnya akan menggunakan teknologi berbasis file system
UI tampaknya akan berevolusi melampaui desktop menjadi antarmuka suara dan visual
Misalnya, dalam panggilan video, sistem membaca ekspresi wajah dan intonasi untuk memperoleh lebih banyak konteks
Belum sepenuhnya multimodal, tetapi sangat menarik
Menulis membantu menata pikiran dan tidak seimpulsif berbicara
Sehebat apa pun STT, kecerdasan manusia tetap beroperasi dengan berpusat pada tulisan
File hanya berguna jika bisa ditemukan
Artinya, pencarian dan indeks itu wajib, tetapi mulai rusak saat skalanya membesar
Karena itu, pertanyaan kuncinya adalah ‘seberapa besar knowledge base yang bisa ditangani agen’
Saya membedah topik ini dari prinsip pertama dalam tulisan “a good agentic KB”
Dalam banyak file yang tertata rapi seperti codebase, agen coding mampu menemukan informasi dengan baik
Tetapi pada data yang berantakan, penataan lewat file system jauh lebih sulit
Ini lebih rumit daripada pencarian berbasis makna di vector DB
Codebase secara alami mempertahankan struktur graf berkat prinsip DRY, tetapi data non-kode tidak demikian
Jadi saya setuju bahwa file system adalah struktur konteks yang baik dalam jangka panjang, tetapi belum bisa sepenuhnya menggantikan pencarian
Menurut saya file system adalah abstraksi yang buruk
Harus menggantungkan file pada struktur sadar berupa pohon direktori itu tidak efisien
Model relasional atau struktur berbasis pengenal unik menurut saya lebih baik
Perubahan pada satu branch tidak memengaruhi branch lain
Sebaliknya, database bisa berbahaya karena UPDATE atau DELETE dapat berdampak ke seluruh sistem
Karena itu, model kompromi berupa struktur pohon dengan indeks DB di atasnya, seperti OS modern, terasa ideal
Nama file diindeks dengan b+tree, dan data file juga disimpan di MFT
Direktori hanyalah baris dengan atribut ‘directory=true’
Pendekatan relasional penuh seperti WinFS gagal karena masalah performa, dan Skydrive kemudian menggantikan posisinya
Rasanya hal ini sering dilupakan
Pada akhirnya, sepertinya kita akan menuju penyimpanan blob bergaya S3 dengan indeks yang bagus, dan direktori akan dibuat on-demand seperti tag
Yang tersisa mungkin hanya fungsi pengelompokan seperti “materi terkait Q3 ada di direktori ini”