- Lapisan wiki untuk agen AI berbasis Markdown & Git
- Lapisan basis pengetahuan native-LLM yang dirancang agar agen AI dapat mengakumulasi konteks lintas sesi, disimpan secara lokal di
~/.wuphf/wiki/ dan dapat dibawa utuh dengan git clone
- Dibangun hanya dengan markdown + git alih-alih infrastruktur berat seperti Postgres, pgvector, Neo4j, dan Kafka, serta mengelola pengetahuan dengan BM25 + SQLite tanpa vector DB
- Disimpan dalam markdown, menggunakan bleve untuk pencarian BM25, dan SQLite untuk metadata terstruktur (facts, entities, edges, redirects, supersedes)
- Dalam benchmark 500 artefak dan 50 kueri tanpa memakai vector DB, mencapai recall@20 85%
- Direncanakan memakai sqlite-vec untuk mengantisipasi bila kelas kueri tertentu turun di bawah tolok ukur ini
- Setiap agen memiliki notebook pribadi di jalur
agents/{slug}/notebook/*.md, dan mengakses wiki bersama di jalur team/
- Ada alur untuk promosi item notebook ke wiki setelah ditinjau oleh agen atau manusia, dan backlink dibuat otomatis
- State machine kecil mengelola masa berlaku (expiry) dan pengarsipan otomatis
- Per-entity fact log: dicatat sebagai JSONL append-only di
team/entities/{kind}-{slug}.facts.jsonl
- Worker sintesis membangun ulang ringkasan entitas setiap N fact, dan commit disimpan dengan identitas git terpisah bernama "Pam the Archivist" sehingga asal-usulnya bisa langsung dilihat di
git log
- Fact ID adalah ID deterministik yang mencakup offset kalimat, dan canonical slug setelah diberikan sekali akan digabungkan lewat redirect stub serta tidak pernah boleh diubah
- Rebuild identik secara logis, tetapi kesamaan byte-per-byte tidak dijamin
- Mendukung [[Wikilinks]], dan tautan rusak dirender merah; lint cron harian mendeteksi kontradiksi, item usang, dan wikilink rusak
- Menyediakan pencarian berbasis kutipan melalui slash command
/lookup dan alat MCP
- Pengklasifikasi heuristik merutekan pencarian singkat ke BM25, dan kueri deskriptif ke loop cited-answer
- Keterbatasan yang diketahui
- Penyetelan recall masih berlangsung, dan angka 85% bukan jaminan umum
- Kualitas sintesis bergantung pada kualitas fact yang dicatat agen (garbage in, garbage out); lint membantu tetapi bukan mesin penilaian
- Saat ini cakupannya satu office saja, belum mendukung federasi lintas office
- Disediakan sebagai bagian dari WUPHF (office agen AI open source yang mendukung Claude Code, Codex, OpenClaw, dan LLM lokal), tetapi lapisan wiki dapat digunakan secara mandiri — jika WUPHF dihubungkan ke setup agen yang sudah ada, wiki akan terpasang otomatis
- Lisensi MIT
1 komentar
Opini Hacker News
Saya kurang paham inti dari otomatisasi catatan. Dulu pun metode menyalin-tempel teks ke catatan sama sekali tidak membantu, jadi saya ragu apakah memperbanyaknya 100 kali akan membuat perbedaan
Bagi saya, inti dari catatan adalah membaca sumber secara kritis, mencernanya sesuai model mental saya, lalu mencatatnya
Detailnya bisa dicari lagi nanti, dan pada akhirnya yang penting adalah proses menyempurnakan model itu
Kalau begitu, mungkin tujuannya justru menyerahkannya ke LLM brain bersama alih-alih membangun model mental itu sendiri
Namun saya cukup ragu apakah pendekatan seperti ini benar-benar bisa menghasilkan sesuatu yang bernilai bagi pemilik produk. Jika produk bernilai bisa dibuat hanya dengan prompt dan harness agen, maka siapa pun bisa membuat ulang produk itu, pengembangan produk sendiri menjadi commodity, dan pada akhirnya mungkin yang tersisa nilainya hanya token
Hipotesis saya adalah do things that don’t scale dari Paul Graham akan tetap relevan ke depan, hanya saja isi dari hal-hal yang tidak bisa diskalakan itu yang kemungkinan berubah
Meski begitu, belakangan ini saya mulai benar-benar memakai Obsidian. Setelah menyiapkan skill untuk mencatat, riset, menghubungkan tautan, memecah, dan menyusun ulang basis pengetahuan, rasanya seperti punya asisten digital yang membantu merapikan
Sekarang saya cukup menuliskan pikiran-pikiran acak, lalu agen membantu memberi struktur, mengajukan pertanyaan lanjutan, dan menghubungkannya ke pekerjaan lain. Membaca sumber dan membangun model mental tetap saya lakukan sendiri, tetapi saya hampir mendapatkan catatan berkualitas secara gratis
Itu pemborosan besar
Kebanyakan hal sebenarnya sejak awal tidak perlu masuk ke catatan, dan LLM justru terlalu banyak menambah noise tanpa verifikasi atau penyaringan yang layak
Ada esai JA Westenberg yang bagus tentang topik ini
https://youtube.com/watch?v=3E00ZNdFbEk
Cukup menarik
Menurut saya titik optimalnya adalah kurasi manusia, dan operasi tanpa pengawasan bukan jawabannya, terutama jika debt atau drift tidak dikelola secara sadar
Apalagi namanya sama dengan produk yang tidak berguna dan redundan Wuphf.com dari The Office
Rasanya sekarang cukup menempelkan AI ke nama produk lalu miliaran dolar datang, dan cukup menyisipkan Karpathy ke tulisan blog lalu direkrut jadi principal engineer di Anthropic
Terasa seperti cuma gerakan memeras uang selama tren ini masih berjalan, dan tidak terlalu memperhatikan apa yang sebenarnya dibutuhkan pelanggan
Semua orang seperti berlari ikut arus selagi ombaknya ada
Bedanya, waktu itu orang benar-benar membangun sesuatu, dan kondisi pendanaan yang lebih ketat sedikit menahan panas berlebih
Setidaknya boom LLM kali ini memang punya kemungkinan dan nilai nyata sampai tingkat tertentu, dan teknologinya juga cukup menyenangkan untuk dipelajari dan dicoba
Sejak lama saya menerima bahwa kalau uang mengalir ke suatu tempat, maka selama tidak tidak etis, masuk akal untuk menangkap peluang di sana. Selagi dana VC/PE melimpah, kita juga bisa membangun sesuatu yang keren dan bernilai
Saya masih menunggu harness CLI kelas dunia yang bisa menggantikan Claude Code. Saya butuh sesuatu yang menyelesaikan masalah memori dan masalah desain
Desain web masih nyaris seperti mimpi buruk kalau dikerjakan dengan LLM
Kami juga menjalankan PoC enterprise, dan semua itu akhirnya mengerucut ke proyek ini yang saya bangun di samping untuk membantu pekerjaan saya sendiri. Hasil akhirnya, antarmuka yang paling enak dipakai untuk context infra ternyata justru ini
Saya tidak tertarik dengan posisi principal engineer di Anthropic. Dulu saya Product Manager di HubSpot dan penghasilan saya jauh lebih besar daripada sekarang, dan kemungkinan beberapa tahun ke depan pun saya belum tentu bisa kembali ke level itu
Saya berulang kali bertaruh dan terus melakukan iterasi karena produknya berkembang lewat percakapan langsung dengan pelanggan. Sementara itu, para pesaing lama masih saja diam-diam membuat AI CRM
Sebagai orang yang sudah lama di industri ini, ombaknya sendiri tidak terlalu penting, tetapi saya yakin ada nilai nyata yang bisa diambil dari bawah ombak itu
Saya melihat ulasan ini: https://zby.github.io/commonplace/agent-memory-systems/reviews/wuphf/
Ini wiki LLM ketiga yang naik ke front page dalam 24 jam, jadi jelas topiknya sedang panas
Saya juga punya kepentingan di area ini, jadi tidak sepenuhnya objektif, tetapi saya sudah merangkum terpisah hal-hal yang saya inginkan dari sistem seperti ini
https://zby.github.io/commonplace/notes/designing-agent-memory-systems/
Rasanya semua orang membangun sistem mereka masing-masing dari nol sehingga biaya duplikasi investasinya terlalu besar; saya harap ada jalan untuk berkolaborasi
Hanya saja dari gaya tulisannya terlihat jelas ditulis oleh LLM, jadi saya penasaran apakah untuk catatan desain seperti ini Anda biasanya merapikannya lagi nanti dengan kata-kata sendiri untuk memastikan itu benar-benar berisi pemikiran Anda
Kami memulai sebagai perusahaan context infra bernama nex.ai jauh sebelum Karpathy mengemukakan ide wiki LLM, dan meskipun fungsi itu masih hampir tidak terlihat di WUPHF, sekarang perlahan kami mulai membukanya
Menyenangkan melihat banyak kekhawatiran yang ditulis di artikel perbandingan itu sudah kami tangani dalam context infra yang kami bangun
Tetap saja, kami sangat terbuka pada kolaborasi untuk mengurangi duplikasi dan saling berbagi pelajaran yang didapat
Anda bilang berharap ada kesempatan berkolaborasi, jadi agak aneh terdengar seolah-olah saat ini tidak ada kesempatan seperti itu
Menambahkan QMD ke vault Obsidian saja sudah mungkin memberi 80%, dan barangkali tidak sampai 2 jam
Untuk konteks, ada juga tautan ke tulisan asli Karpathy
https://x.com/karpathy/status/2039805659525644595
https://xcancel.com/karpathy/status/2039805659525644595
Saya penasaran apakah AI Notes akan menambah nilai atau malah cuma menambah noise
Tapi gaya ASCII situsnya cukup saya suka
Sebagai solusi untuk masalah ini, saya berharap ada yang membuat sesuatu seperti kebangkitan StackOverflow
Kurasi dilakukan manusia, tetapi jika sekumpulan LLM kolektif mentok saat memecahkan masalah, mereka mengajukan pertanyaan dengan cara lama sehingga menjadi graf pengetahuan terdistribusi
Kalau agen saya berkata, "Saya mentok di sini, saya sudah memposting pertanyaan di SO, jadi mari kembali lagi nanti kalau ada jawaban," rasanya itu sudah cukup baik
Saya penasaran bagaimana caranya mencegah LLM menulis terlalu banyak
Saya sudah membuat beberapa alat dan sistem serupa, dan semuanya berakhir sama: LLM terus menggembungkan dokumen sampai seluruh sistem jadi berantakan, dan makin besar justru makin tidak berguna
Salah satu eksperimen yang pernah saya lakukan dulu adalah memberi beberapa tautan lalu membiarkan LLM meneliti topik terkait, membuat wiki pengetahuan-nya sendiri, dan menyusun ringkasan, tautan silang, serta sumber di setiap halaman
Dari luar terlihat bagus, tetapi saat data nyatanya dibaca hasilnya kurang meyakinkan
Itu eksperimen beberapa tahun lalu, jadi mungkin sekarang ada gunanya dicoba lagi dengan sesuatu seperti opus 4.7
Sebagai bahan pemikiran, komunitas TiddlyWiki tentu juga sudah mengeksplorasi alat AI
TiddlyWiki adalah wiki berbasis satu file HTML yang bisa memodifikasi dirinya sendiri, dan sudah bertahan lebih dari 20 tahun
Memang belum benar-benar berkembang menjadi lingkungan agentic, tetapi ada plugin markdown, serta alat untuk membuat file bisa dieksekusi atau diubah menjadi webapp self-serving. Git agak merepotkan
Jadi secara teori, wiki agentic satu file yang berkeliling sambil memodifikasi dirinya sendiri pun memungkinkan
https://tiddlywiki.com/
Konfigurasi single-file yang Anda sebut sudah punya beberapa konektor LLM. Misalnya https://github.com/rimir-cc/tw-llm-connect
Daya tariknya memang tepat di situ. Tidak ada dependensi, tidak perlu instalasi, dan sangat mudah disimpan, jadi konfigurasi wiki agentic satu file yang mengedit dirinya sendiri sudah bisa dilakukan hari ini juga
Yang lebih dekat ke pola LLM Wiki ala Karpathy, saya juga sedang mengerjakan twillm
https://github.com/Jermolene/twillm
Ini memakai konfigurasi Node.js milik TiddlyWiki, menyimpan tiddler sebagai file terpisah, sehingga bisa langsung menunjuk ke vault Markdown yang sudah ada dan dipakai bersama alat seperti Claude Code
Kelebihan TiddlyWiki juga cukup jelas. Karena open source, ia bisa terus dipakai dalam jangka panjang, dan karena berbasis web, ia bisa diakses dari mana saja
Selain itu, computed view menggantikan file indeks materialized. Dalam pendekatan Karpathy, LLM harus terus menyinkronkan index.md setiap kali menambahkan catatan, dan hal seperti ini mudah menjadi stale setiap kali sesi berganti, yang justru sangat tidak dikuasai LLM
Sebaliknya, view TiddlyWiki adalah ekspresi filter real-time, sehingga misalnya hasil seperti "tiddler bertag concept diurutkan berdasarkan rating" dihitung langsung saat render
Frontmatter juga menjadi struktur yang bisa di-query. Obsidian menampilkan YAML frontmatter sebagai metadata berbentuk kotak di bagian atas catatan, sedangkan TiddlyWiki mengangkat field itu menjadi field tiddler kelas satu yang bisa langsung dipakai untuk filter, sortir, dan agregasi
Dan LLM tidak hanya bisa menulis konten, tetapi juga applet kecil. Selain catatan Markdown, ia bisa menambahkan tiddler wikitext (.tid) untuk membuat live view interaktif seperti dashboard, alat penjelajah tag, indeks jurnal, atau glosarium
Area self building artefacts menarik, dan belakangan ini sedang tumbuh besar seiring LLM, terutama model coding, cepat sekali makin kuat di sini
Saya juga baru-baru ini bereksperimen dengan proyek yang berfokus pada minim dependensi dan pengendalian agen secara lokal
https://github.com/GistNoesis/Shoggoth.db/
Untuk menjalankan tugas jangka panjang yang diberikan lewat prompt, sistem ini membuat dan merapikan database sqlite sendiri, dan memakai salinan Wikipedia lokal sebagai data sumber
Saya juga hanya menaruh harness dan alat yang sangat minimal untuk bereksperimen dengan drift agen
Menambahkan alat pemrosesan gambar juga cukup mudah. Gambar tinggal di-encode ke base64 lalu dikirim ke llama.cpp, dan detail implementasinya pun bisa asal divibecoding dengan LLM lokal
Menurut saya ini alat yang cukup berguna secara umum
Misalnya dulu saya punya skrip yang memakai Amazon Textract untuk mengekstrak nominal, tanggal, dan penjual dari faktur dan kuitansi dalam folder, lalu setelah itu angka-angkanya dicek manusia untuk membuat CSV yang akan diberikan ke akuntan
Sekarang panggilan Amazon Textract itu bisa diganti dengan pemanggilan model llama.cpp dengan prompt yang tepat, sambil tetap mempertahankan alat faktur yang sudah ada dan sekaligus memungkinkan pemrosesan akuntansi yang jauh lebih kreatif
Saya juga bereksperimen dengan variasi yang menggerakkan robot fisik dari rangkaian gambar kamera, dan untuk kasus sederhana memang benar-benar bergerak dan mencapai tujuan
Hanya saja LLM yang saya pakai memang tidak pernah dilatih untuk mengemudikan robot, dan butuh 10 detik untuk memilih tindakan berikutnya sehingga tidak praktis. Kontroler konvensional non-deep-learning yang saya pakai saat ini menjalankan vision loop di 20Hz
Model LLM dan agen di atasnya bukan deterministik, melainkan probabilistik
Mereka bisa berhasil melakukan sesuatu pada persentase tertentu, tetapi tidak selalu berhasil setiap kali
Karena itu, makin lama agen mempertahankan satu tugas, makin besar pula peluang gagalnya. Agen jangka panjang seperti ini pada akhirnya akan gagal, dan di sepanjang prosesnya juga membakar biaya token yang sangat besar
Salah satu hal yang dikuasai agen LLM adalah menulis ulang instruksinya sendiri
Triknya adalah membatasi waktu dan langkah berpikir model thinking, lalu mengevaluasi, memperbarui, dan menjalankannya lagi
Analogi sederhananya, anggap saja agen itu mudah jatuh. Jangan buat dia berlari terlalu lama sampai jatuh; dua kali 5 menit lebih baik daripada sekali 10 menit
Dalam beberapa minggu, agen swa-rujuk seperti ini kemungkinan akan memenuhi bagian atas feed Twitter semua orang
Jadi wiki seperti ini kemungkinan besar akan mencapai suatu keadaan lalu berhenti di sana