36 poin oleh GN⁺ 2026-03-09 | 1 komentar | Bagikan ke WhatsApp
  • Dalam ekosistem AI agent belakangan ini, filesystem kembali menjadi sorotan dan muncul sebagai sarana pengelolaan konteks persisten yang berbeda dari database
  • Context window pada LLM lebih mirip papan tulis yang terus terhapus daripada memori persisten, dan filesystem adalah sarana penyimpanan permanen paling sederhana untuk mengatasinya
  • Claude Code, Cursor, dan lainnya mewujudkan memori jangka panjang melalui penyimpanan konteks berbasis file, dengan file seperti CLAUDE.md dan aboutme.md berperan menyimpan identitas agen dan informasi lingkungan
  • Pengelolaan konteks berbasis filesystem muncul sebagai topik utama, dengan perusahaan besar seperti LlamaIndex, LangChain, Oracle, dan Archil berturut-turut merilis tulisan dan produk terkait
  • Di tengah menjamurnya file konteks agen seperti CLAUDE.md, AGENTS.md, dan .cursorrules, format Agent Skills (SKILL.md) dari Anthropic diadopsi oleh Microsoft, OpenAI, GitHub, Cursor, dan lainnya sehingga memperoleh interoperabilitas
  • Menurut riset ETH Zürich, file konteks justru dapat menurunkan tingkat keberhasilan tugas dan meningkatkan biaya inferensi lebih dari 20%, sehingga sebaiknya hanya memuat kebutuhan minimum
  • File tidak terikat pada aplikasi tertentu, dan di era AI agent kini menempatkan diri sebagai antarmuka terbuka yang memungkinkan perpindahan antaralat, penggabungan workflow, dan kesinambungan

Everyone is talking about files : semua orang sedang membicarakan file

Context window bukan memori

  • Memori manusia mencakup penyimpanan jangka panjang, pemanggilan kembali secara selektif, dan kemampuan melupakan informasi yang tidak perlu, tetapi context window pada LLM lebih dekat ke papan tulis yang terus terhapus
  • Saat menggunakan Claude Code, ketika notifikasi "context left until auto-compact" mendekat, konteks yang telah dikumpulkan agen—seperti codebase, preferensi, dan keputusan—akan dikompresi atau hilang
  • Filesystem menyelesaikan hal ini dengan cara paling sederhana: tulis catatan ke file, lalu baca kembali saat diperlukan
    • CLAUDE.md menyediakan konteks persisten tentang proyek
    • Cursor menyimpan riwayat chat lama sebagai file yang dapat ditelusuri
    • File aboutme.md berperan sebagai deskriptor identitas portabel yang memuat preferensi, keterampilan, dan gaya kerja, serta dapat berpindah antarapp tanpa orkestrasi API

Riset ETH Zürich: paradoks file konteks

  • Makalah terbaru dari ETH Zürich mengevaluasi apakah file konteks tingkat repositori benar-benar membantu agen coding menyelesaikan tugas
  • Hasilnya berlawanan dengan intuisi: di berbagai agen dan model, file konteks justru menurunkan tingkat keberhasilan tugas, sementara biaya inferensi naik lebih dari 20%
    • Agen yang diberi file konteks menjelajah lebih luas, menjalankan lebih banyak pengujian, dan menelusuri lebih banyak file, tetapi justru terlambat mencapai kode yang benar-benar perlu diperbaiki
    • File itu bekerja seperti checklist yang diikuti agen terlalu serius
  • Kesimpulan makalah tersebut bukan "jangan gunakan file konteks", melainkan persyaratan yang tidak perlu membuat tugas makin sulit, sehingga file konteks seharusnya hanya menjelaskan kebutuhan minimum
  • Masalahnya bukan pada lapisan persisten filesystem itu sendiri, melainkan praktik menulis CLAUDE.md seperti dokumen onboarding sepanjang 2.000 kata

Format file adalah API — tetapi file yang mana?

  • Saat ini CLAUDE.md, AGENTS.md, copilot-instructions.md, dan .cursorrules hidup berdampingan; ada kesepakatan bahwa agen membutuhkan konteks persisten berbasis filesystem, tetapi nama file dan format isinya belum disepakati
  • Dalam tulisan Dan Abramov tentang social filesystem, desain intinya adalah: AT Protocol memperlakukan data pengguna sebagai file dalam repositori pribadi, dan aplikasi tidak perlu sepakat tentang apa itu "post" karena benturan dicegah lewat namespace berbasis nama domain
    • Database semua aplikasi menjadi data turunan, yaitu cached materialized view dari folder semua pengguna
  • Anthropic mengumumkan Agent Skills sebagai standar terbuka: format SKILL.md diadopsi oleh Microsoft, OpenAI, Atlassian, GitHub, dan Cursor
    • Skill yang ditulis untuk Claude Code juga berjalan di Codex dan Copilot — format file adalah API
  • NanoClaw adalah framework asisten AI pribadi yang ringan dan mengadopsi model "skill alih-alih fitur"
    • Jika membutuhkan dukungan Telegram, bukan modul Telegram melainkan skill /add-telegram (file Markdown) yang mengajarkan Claude Code cara mengintegrasikannya
    • Karena skill adalah file, ia portabel, dapat diaudit, dan dapat dikombinasikan — tanpa perlu server MCP atau marketplace plugin
  • Inilah interoperabilitas tanpa koordinasi: jika dua aplikasi bisa membaca Markdown, keduanya bisa berbagi konteks; jika keduanya memahami format SKILL.md, keduanya bisa berbagi fungsi; tanpa kontrak kemitraan atau rapat lembaga standardisasi, format file itu sendiri menjalankan peran koordinasi

Perpindahan bottleneck

  • Arsitektur data tradisional dirancang dengan asumsi bahwa storage adalah bottleneck, tetapi ketika kemampuan pemrosesan melampaui storage I/O, paradigma pun bergeser ke pemisahan storage dan compute (S3 + cluster compute sementara)
  • Fenomena serupa terjadi pada AI agent: bottleneck bukan performa model atau compute, melainkan konteks
    • Model sudah cukup pintar, tetapi pelupa
    • Filesystem adalah cara paling efektif mengelola konteks persisten tepat di titik tempat agen berjalan (mesin pengembang, lingkungan, dan data yang sudah ada di sana)

Filesystem pada dasarnya sudah berupa graf

  • Di Twitter ada komentar bahwa orang yang memakai filesystem sambil mengatakan agen tidak butuh graf sebenarnya sedang menyangkal bahwa mereka sudah memakai graf
    • Filesystem terdiri dari direktori, subdirektori, dan file dalam struktur pohon, yaitu directed acyclic graph (DAG)
    • Saat agen menjalankan ls, grep, membaca file, dan mengikuti referensi, ia sebenarnya sudah menelusuri graf
  • Richmond dalam tulisan Oracle memberikan pembedaan paling tajam: filesystem menang sebagai antarmuka, database menang sebagai lapisan dasar
    • Ketika kebutuhan seperti akses serentak, semantic search skala besar, deduplikasi, dan pembobotan recency muncul, pada akhirnya orang akan membangun indeks sendiri, yang pada dasarnya adalah database
  • Antarmuka file kuat karena universal dan sudah dipahami LLM, sementara lapisan dasar berbasis database kuat karena menyediakan jaminan yang dibutuhkan dalam operasi nyata
  • Masa depan bukan file versus database, melainkan struktur di mana file menjadi antarmuka interaksi manusia dan agen, sementara lapisan dasar di bawahnya disesuaikan dengan use case

Ini adalah redefinisi personal computing

  • Filesystem dapat mendefinisikan ulang makna personal computing di era AI
    • Data, konteks, preferensi, skill, dan memori hadir dalam format yang dimiliki pengguna, dapat dibaca agen mana pun, dan tidak terkunci pada aplikasi tertentu
    • aboutme.md bekerja baik di OpenClaw/NanoClaw hari ini maupun di alat baru besok
    • File skill dapat dipindahkan, dan konteks proyek tetap bertahan melampaui alat tertentu
  • Ini adalah bentuk yang sejak awal dituju personal computing sebelum semuanya berpindah ke aplikasi SaaS tertutup dan database proprietari
    • File adalah protokol terbuka yang asli, dan ketika AI agent menjadi antarmuka utama komputasi, file menjadi lapisan interoperabilitas yang memungkinkan perpindahan alat, penggabungan workflow, dan kesinambungan antar aplikasi tanpa izin siapa pun
  • Meski begitu, ada sisi idealistis: sejarah format terbuka dipenuhi standar yang menang di atas kertas tetapi gagal dalam praktik
    • Perusahaan memiliki insentif kuat untuk membuat file konteks mereka sedikit berbeda demi mempertahankan switching cost
    • Fakta bahwa CLAUDE.md, AGENTS.md, dan .cursorrules hidup berdampingan alih-alih menjadi satu format universal menunjukkan bahwa fragmentasi adalah default
    • Makalah ETH Zürich mengingatkan bahwa sekalipun formatnya ada, menulis file konteks yang baik tetap sulit, dan file konteks yang buruk bisa lebih buruk daripada tidak ada sama sekali
  • Pesan inti Dan Abramov:

    Memori, pemikiran, dan desain kita harus bertahan lebih lama daripada perangkat lunak yang membuatnya

    • Ini bukan klaim teknis melainkan persoalan nilai, dan filesystem cocok menjalankan peran ini bukan karena ia teknologi terbaik, tetapi karena ia sudah menjadi satu-satunya teknologi yang dimiliki pengguna

1 komentar

 
GN⁺ 2026-03-09
Komentar Hacker News
  • File adalah bentuk kebebasan yang mendasar karena memungkinkan pengguna benar-benar memiliki datanya sendiri
    Ini memungkinkan kedaulatan atas kerahasiaan, integritas, dan ketersediaan
    Sebagai pilar utama kebebasan digital, ini seharusnya dipandang setara dengan lisensi FOSS

    • Berkat kemampuan penalaran LLM, sekarang kita tidak perlu terlalu khawatir soal struktur file
      Bahasa alami itu sendiri bisa berada di dalam file, dan keterbacaan menjadi spesifikasi
      Siapa pun yang bisa menulis dengan mudah dibaca manusia dapat menulis ke file, dan file itu bisa dijalankan langsung seperti REPL
    • Karena itu, upaya perusahaan teknologi besar seperti Apple untuk menghapus konsep file terasa mengganggu
      Data jadi terikat ke aplikasi dan tidak bisa eksis secara mandiri, serta sulit diimpor/diekspor
      Untuk mengatasi masalah ini, saya sedang membuat alat yang mengekstrak data dari backup menjadi unit file granular lalu memindahkannya ke perpustakaan digital pribadi
      Data yang immutable cukup diarsipkan, tetapi tantangan terbesarnya adalah membuat data yang bisa diubah kembali menjadi bentuk ‘hidup’ yang dapat diedit di aplikasi
    • Saya merasa file konfigurasi jauh lebih baik daripada penyimpanan terpusat seperti Windows Registry
      Perubahan sementara dan berbagi jadi mudah, dan makna dari konfigurasi didefinisikan dengan jelas
      Saya tidak suka bagaimana Windows memperlakukan file seperti warga kelas tiga
  • Saya berpikir sama dari sudut pandang SaaS
    Semakin kode bersifat sementara dan spesifik domain, semakin data (file) harus standar dan stabil sampai terasa membosankan
    Format yang hanya bisa dibaca aplikasi tertentu adalah utang teknis, dan pada akhirnya merusak proyek
    Alasan file JPEG dari 1995 masih bisa dibuka sampai sekarang adalah karena ia tidak bergantung pada perangkat lunak tertentu

    • Sistem pengelolaan foto saya yang sudah berusia lebih dari 10 tahun menjadikan file system dan EXIF sebagai sumber kebenaran
      Ini adalah pendekatan yang sudah berkali-kali terbukti benar
      Lapisan abstraksi seperti Google Photos atau Immich hanyalah soal kenyamanan; intinya tetap file
      Di pekerjaan juga saya mengelola riset dan dokumen dengan file markdown dan csv
      tautan proyek elodie
    • Masalah pengelolaan foto saat ini adalah edit, tag, dan informasi album semuanya disimpan sebagai metadata eksternal
      Saat pindah platform, seluruh riwayat edit hilang
      Fitur undo memang nyaman, tetapi saya berharap perubahan seperti ini distandardisasi agar portabel
  • Saya ingin menyebut Plan 9 dari Bell Labs
    Plan 9 from Bell Labs

    • Saya sedang membuat orchestrator agen bernama agenc
      Saya bertanya ke Claude tentang riset pendahuluan, dan ia menyebut Plan 9; itulah tepatnya konsep yang kita butuhkan sekarang
      Filosofi meminimalkan hak akses agen sama dengan model keamanan perusahaan
      Hanya saja Plan 9 hadir terlalu dini
    • Untuk file system baru, GeFS layak dilihat
  • Ini kembali mengingatkan saya bahwa Plan 9 dan UNIX memang benar
    Antarmuka paling kuat adalah file teks di atas file system
    Kini saatnya membuat 9p2026 lagi
    Hanya saja, beberapa konsep dasar dalam tulisan itu keliru — file system bukan pohon, melainkan graf yang bisa bersiklus

    • Saya penasaran apa fungsi inti Plan 9, apakah bisa ditempel dengan FUSE, atau perlu sihir yang lebih dalam
  • Ini sangat relate buat saya juga
    Selama setahun terakhir saya telah memindahkan data pribadi dari belasan SaaS ke satu struktur direktori
    File system yang tertata sudah cukup untuk pengguna tunggal, dan menghilangkan fragmentasi data
    Ke depan, sepertinya akan muncul database baru yang mendukung penulisan multi-pengguna yang aman tanpa membuat file system jadi opak
    Rasanya mirip dengan peran QMD untuk pencarian

  • Saat ini pemanfaatan AI masih berada di fase belum matang
    Sistem produksi akan berjalan di atas struktur data yang konsisten dan dapat diskalakan, tetapi agen yang membangunnya akan menggunakan teknologi berbasis file system
    UI tampaknya akan berevolusi melampaui desktop menjadi antarmuka suara dan visual
    Misalnya, dalam panggilan video, sistem membaca ekspresi wajah dan intonasi untuk memperoleh lebih banyak konteks

    • Dalam video demo AI yang baru saya lihat, konteks diekstrak dari suara dan gestur tubuh, lalu diubah menjadi teks sebelum dimasukkan ke LLM
      Belum sepenuhnya multimodal, tetapi sangat menarik
    • Meski begitu, input teks sepertinya tidak akan hilang
      Menulis membantu menata pikiran dan tidak seimpulsif berbicara
      Sehebat apa pun STT, kecerdasan manusia tetap beroperasi dengan berpusat pada tulisan
  • File hanya berguna jika bisa ditemukan
    Artinya, pencarian dan indeks itu wajib, tetapi mulai rusak saat skalanya membesar
    Karena itu, pertanyaan kuncinya adalah ‘seberapa besar knowledge base yang bisa ditangani agen’
    Saya membedah topik ini dari prinsip pertama dalam tulisan “a good agentic KB”

  • Dalam banyak file yang tertata rapi seperti codebase, agen coding mampu menemukan informasi dengan baik
    Tetapi pada data yang berantakan, penataan lewat file system jauh lebih sulit
    Ini lebih rumit daripada pencarian berbasis makna di vector DB
    Codebase secara alami mempertahankan struktur graf berkat prinsip DRY, tetapi data non-kode tidak demikian
    Jadi saya setuju bahwa file system adalah struktur konteks yang baik dalam jangka panjang, tetapi belum bisa sepenuhnya menggantikan pencarian

  • Menurut saya file system adalah abstraksi yang buruk
    Harus menggantungkan file pada struktur sadar berupa pohon direktori itu tidak efisien
    Model relasional atau struktur berbasis pengenal unik menurut saya lebih baik

    • Kelebihan file system adalah menjaga lokalitas perubahan
      Perubahan pada satu branch tidak memengaruhi branch lain
      Sebaliknya, database bisa berbahaya karena UPDATE atau DELETE dapat berdampak ke seluruh sistem
      Karena itu, model kompromi berupa struktur pohon dengan indeks DB di atasnya, seperti OS modern, terasa ideal
    • NTFS secara internal menggunakan database MFT
      Nama file diindeks dengan b+tree, dan data file juga disimpan di MFT
      Direktori hanyalah baris dengan atribut ‘directory=true’
      Pendekatan relasional penuh seperti WinFS gagal karena masalah performa, dan Skydrive kemudian menggantikan posisinya
    • Di sebagian besar file system, file diidentifikasi secara unik lewat inode dan bisa direferensikan oleh beberapa link
      Rasanya hal ini sering dilupakan
    • UUID memang opak bagi manusia, tetapi bagi agen itu adalah pengenal yang sepenuhnya terbedakan
      Pada akhirnya, sepertinya kita akan menuju penyimpanan blob bergaya S3 dengan indeks yang bagus, dan direktori akan dibuat on-demand seperti tag
      Yang tersisa mungkin hanya fungsi pengelompokan seperti “materi terkait Q3 ada di direktori ini”