2 poin oleh GN⁺ 21 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Lapisan wiki untuk agen AI berbasis Markdown & Git
  • Lapisan basis pengetahuan native-LLM yang dirancang agar agen AI dapat mengakumulasi konteks lintas sesi, disimpan secara lokal di ~/.wuphf/wiki/ dan dapat dibawa utuh dengan git clone
  • Dibangun hanya dengan markdown + git alih-alih infrastruktur berat seperti Postgres, pgvector, Neo4j, dan Kafka, serta mengelola pengetahuan dengan BM25 + SQLite tanpa vector DB
    • Disimpan dalam markdown, menggunakan bleve untuk pencarian BM25, dan SQLite untuk metadata terstruktur (facts, entities, edges, redirects, supersedes)
    • Dalam benchmark 500 artefak dan 50 kueri tanpa memakai vector DB, mencapai recall@20 85%
    • Direncanakan memakai sqlite-vec untuk mengantisipasi bila kelas kueri tertentu turun di bawah tolok ukur ini
  • Setiap agen memiliki notebook pribadi di jalur agents/{slug}/notebook/*.md, dan mengakses wiki bersama di jalur team/
    • Ada alur untuk promosi item notebook ke wiki setelah ditinjau oleh agen atau manusia, dan backlink dibuat otomatis
    • State machine kecil mengelola masa berlaku (expiry) dan pengarsipan otomatis
  • Per-entity fact log: dicatat sebagai JSONL append-only di team/entities/{kind}-{slug}.facts.jsonl
    • Worker sintesis membangun ulang ringkasan entitas setiap N fact, dan commit disimpan dengan identitas git terpisah bernama "Pam the Archivist" sehingga asal-usulnya bisa langsung dilihat di git log
    • Fact ID adalah ID deterministik yang mencakup offset kalimat, dan canonical slug setelah diberikan sekali akan digabungkan lewat redirect stub serta tidak pernah boleh diubah
    • Rebuild identik secara logis, tetapi kesamaan byte-per-byte tidak dijamin
  • Mendukung [[Wikilinks]], dan tautan rusak dirender merah; lint cron harian mendeteksi kontradiksi, item usang, dan wikilink rusak
  • Menyediakan pencarian berbasis kutipan melalui slash command /lookup dan alat MCP
    • Pengklasifikasi heuristik merutekan pencarian singkat ke BM25, dan kueri deskriptif ke loop cited-answer
  • Keterbatasan yang diketahui
    • Penyetelan recall masih berlangsung, dan angka 85% bukan jaminan umum
    • Kualitas sintesis bergantung pada kualitas fact yang dicatat agen (garbage in, garbage out); lint membantu tetapi bukan mesin penilaian
    • Saat ini cakupannya satu office saja, belum mendukung federasi lintas office
  • Disediakan sebagai bagian dari WUPHF (office agen AI open source yang mendukung Claude Code, Codex, OpenClaw, dan LLM lokal), tetapi lapisan wiki dapat digunakan secara mandiri — jika WUPHF dihubungkan ke setup agen yang sudah ada, wiki akan terpasang otomatis
  • Lisensi MIT

1 komentar

 
GN⁺ 21 hari lalu
Opini Hacker News
  • Saya kurang paham inti dari otomatisasi catatan. Dulu pun metode menyalin-tempel teks ke catatan sama sekali tidak membantu, jadi saya ragu apakah memperbanyaknya 100 kali akan membuat perbedaan
    Bagi saya, inti dari catatan adalah membaca sumber secara kritis, mencernanya sesuai model mental saya, lalu mencatatnya
    Detailnya bisa dicari lagi nanti, dan pada akhirnya yang penting adalah proses menyempurnakan model itu

    • Ini tampaknya lebih dari sekadar mencatat. Praktis lebih mirip harness lain untuk mengoordinasikan pekerjaan antar agen dengan campur tangan manusia seminimal mungkin
      Kalau begitu, mungkin tujuannya justru menyerahkannya ke LLM brain bersama alih-alih membangun model mental itu sendiri
      Namun saya cukup ragu apakah pendekatan seperti ini benar-benar bisa menghasilkan sesuatu yang bernilai bagi pemilik produk. Jika produk bernilai bisa dibuat hanya dengan prompt dan harness agen, maka siapa pun bisa membuat ulang produk itu, pengembangan produk sendiri menjadi commodity, dan pada akhirnya mungkin yang tersisa nilainya hanya token
      Hipotesis saya adalah do things that don’t scale dari Paul Graham akan tetap relevan ke depan, hanya saja isi dari hal-hal yang tidak bisa diskalakan itu yang kemungkinan berubah
      Meski begitu, belakangan ini saya mulai benar-benar memakai Obsidian. Setelah menyiapkan skill untuk mencatat, riset, menghubungkan tautan, memecah, dan menyusun ulang basis pengetahuan, rasanya seperti punya asisten digital yang membantu merapikan
      Sekarang saya cukup menuliskan pikiran-pikiran acak, lalu agen membantu memberi struktur, mengajukan pertanyaan lanjutan, dan menghubungkannya ke pekerjaan lain. Membaca sumber dan membangun model mental tetap saya lakukan sendiri, tetapi saya hampir mendapatkan catatan berkualitas secara gratis
    • Saya rasa masalah seriusnya adalah orang membuat begitu banyak pekerjaan remeh dengan AI lalu tidak pernah melihatnya lagi
      Itu pemborosan besar
    • Untuk urusan mencatat saya sepenuhnya setuju. Catatan diperlakukan terlalu enteng, dan akhirnya menumpuk melebihi kebutuhan seperti loteng atau ruang bawah tanah
      Kebanyakan hal sebenarnya sejak awal tidak perlu masuk ke catatan, dan LLM justru terlalu banyak menambah noise tanpa verifikasi atau penyaringan yang layak
      Ada esai JA Westenberg yang bagus tentang topik ini
      https://youtube.com/watch?v=3E00ZNdFbEk
    • Dari sedikit riset ilmiah yang sudah terbit sejauh ini, ketika koleksi markdown seperti ini dipelihara sepenuhnya oleh LLM, kualitas hasilnya justru menurun, sedangkan ketika dipelihara manusia hasilnya membaik
      Cukup menarik
      Menurut saya titik optimalnya adalah kurasi manusia, dan operasi tanpa pengawasan bukan jawabannya, terutama jika debt atau drift tidak dikelola secara sadar
    • Awalnya saya juga kira ini parodi
      Apalagi namanya sama dengan produk yang tidak berguna dan redundan Wuphf.com dari The Office
  • Rasanya sekarang cukup menempelkan AI ke nama produk lalu miliaran dolar datang, dan cukup menyisipkan Karpathy ke tulisan blog lalu direkrut jadi principal engineer di Anthropic
    Terasa seperti cuma gerakan memeras uang selama tren ini masih berjalan, dan tidak terlalu memperhatikan apa yang sebenarnya dibutuhkan pelanggan
    Semua orang seperti berlari ikut arus selagi ombaknya ada

    • Mirip NFT, sebelumnya blockchain, dan dalam beberapa hal juga mirip demam Web 2.0
      Bedanya, waktu itu orang benar-benar membangun sesuatu, dan kondisi pendanaan yang lebih ketat sedikit menahan panas berlebih
      Setidaknya boom LLM kali ini memang punya kemungkinan dan nilai nyata sampai tingkat tertentu, dan teknologinya juga cukup menyenangkan untuk dipelajari dan dicoba
      Sejak lama saya menerima bahwa kalau uang mengalir ke suatu tempat, maka selama tidak tidak etis, masuk akal untuk menangkap peluang di sana. Selagi dana VC/PE melimpah, kita juga bisa membangun sesuatu yang keren dan bernilai
    • Bukankah yang penting jadi dulu. Ada alasan semua orang membuat alat AI, dan faktanya kita semua membelinya
      Saya masih menunggu harness CLI kelas dunia yang bisa menggantikan Claude Code. Saya butuh sesuatu yang menyelesaikan masalah memori dan masalah desain
      Desain web masih nyaris seperti mimpi buruk kalau dikerjakan dengan LLM
    • Tahun lalu saya sudah membuat CRM AI-native dengan dukungan pendiri HubSpot, Dharmesh Shah, sudah ada pendapatan juga, lalu dari situ saya beberapa kali mengubah arah dan menyimpulkan bahwa context graph infra adalah moat yang tepat
      Kami juga menjalankan PoC enterprise, dan semua itu akhirnya mengerucut ke proyek ini yang saya bangun di samping untuk membantu pekerjaan saya sendiri. Hasil akhirnya, antarmuka yang paling enak dipakai untuk context infra ternyata justru ini
      Saya tidak tertarik dengan posisi principal engineer di Anthropic. Dulu saya Product Manager di HubSpot dan penghasilan saya jauh lebih besar daripada sekarang, dan kemungkinan beberapa tahun ke depan pun saya belum tentu bisa kembali ke level itu
      Saya berulang kali bertaruh dan terus melakukan iterasi karena produknya berkembang lewat percakapan langsung dengan pelanggan. Sementara itu, para pesaing lama masih saja diam-diam membuat AI CRM
      Sebagai orang yang sudah lama di industri ini, ombaknya sendiri tidak terlalu penting, tetapi saya yakin ada nilai nyata yang bisa diambil dari bawah ombak itu
  • Saya melihat ulasan ini: https://zby.github.io/commonplace/agent-memory-systems/reviews/wuphf/
    Ini wiki LLM ketiga yang naik ke front page dalam 24 jam, jadi jelas topiknya sedang panas
    Saya juga punya kepentingan di area ini, jadi tidak sepenuhnya objektif, tetapi saya sudah merangkum terpisah hal-hal yang saya inginkan dari sistem seperti ini
    https://zby.github.io/commonplace/notes/designing-agent-memory-systems/
    Rasanya semua orang membangun sistem mereka masing-masing dari nol sehingga biaya duplikasi investasinya terlalu besar; saya harap ada jalan untuk berkolaborasi

    • Catatannya cukup menarik
      Hanya saja dari gaya tulisannya terlihat jelas ditulis oleh LLM, jadi saya penasaran apakah untuk catatan desain seperti ini Anda biasanya merapikannya lagi nanti dengan kata-kata sendiri untuk memastikan itu benar-benar berisi pemikiran Anda
    • Saya sangat menyukai bagian Borrowable Ideas, dan semoga benar-benar banyak yang mengambil ide dari sana
      Kami memulai sebagai perusahaan context infra bernama nex.ai jauh sebelum Karpathy mengemukakan ide wiki LLM, dan meskipun fungsi itu masih hampir tidak terlihat di WUPHF, sekarang perlahan kami mulai membukanya
      Menyenangkan melihat banyak kekhawatiran yang ditulis di artikel perbandingan itu sudah kami tangani dalam context infra yang kami bangun
      Tetap saja, kami sangat terbuka pada kolaborasi untuk mengurangi duplikasi dan saling berbagi pelajaran yang didapat
    • Jelas ada sisi di mana slot machine generatif membuat orang terisolasi
      Anda bilang berharap ada kesempatan berkolaborasi, jadi agak aneh terdengar seolah-olah saat ini tidak ada kesempatan seperti itu
    • Akan saya baca
    • Sejujurnya menurut saya sekarang kita sudah masuk ke wilayah bangun dan jalankan sendiri
      Menambahkan QMD ke vault Obsidian saja sudah mungkin memberi 80%, dan barangkali tidak sampai 2 jam
  • Untuk konteks, ada juga tautan ke tulisan asli Karpathy
    https://x.com/karpathy/status/2039805659525644595
    https://xcancel.com/karpathy/status/2039805659525644595

  • Saya penasaran apakah AI Notes akan menambah nilai atau malah cuma menambah noise
    Tapi gaya ASCII situsnya cukup saya suka

  • Sebagai solusi untuk masalah ini, saya berharap ada yang membuat sesuatu seperti kebangkitan StackOverflow
    Kurasi dilakukan manusia, tetapi jika sekumpulan LLM kolektif mentok saat memecahkan masalah, mereka mengajukan pertanyaan dengan cara lama sehingga menjadi graf pengetahuan terdistribusi
    Kalau agen saya berkata, "Saya mentok di sini, saya sudah memposting pertanyaan di SO, jadi mari kembali lagi nanti kalau ada jawaban," rasanya itu sudah cukup baik

  • Saya penasaran bagaimana caranya mencegah LLM menulis terlalu banyak
    Saya sudah membuat beberapa alat dan sistem serupa, dan semuanya berakhir sama: LLM terus menggembungkan dokumen sampai seluruh sistem jadi berantakan, dan makin besar justru makin tidak berguna
    Salah satu eksperimen yang pernah saya lakukan dulu adalah memberi beberapa tautan lalu membiarkan LLM meneliti topik terkait, membuat wiki pengetahuan-nya sendiri, dan menyusun ringkasan, tautan silang, serta sumber di setiap halaman
    Dari luar terlihat bagus, tetapi saat data nyatanya dibaca hasilnya kurang meyakinkan
    Itu eksperimen beberapa tahun lalu, jadi mungkin sekarang ada gunanya dicoba lagi dengan sesuatu seperti opus 4.7

  • Sebagai bahan pemikiran, komunitas TiddlyWiki tentu juga sudah mengeksplorasi alat AI
    TiddlyWiki adalah wiki berbasis satu file HTML yang bisa memodifikasi dirinya sendiri, dan sudah bertahan lebih dari 20 tahun
    Memang belum benar-benar berkembang menjadi lingkungan agentic, tetapi ada plugin markdown, serta alat untuk membuat file bisa dieksekusi atau diubah menjadi webapp self-serving. Git agak merepotkan
    Jadi secara teori, wiki agentic satu file yang berkeliling sambil memodifikasi dirinya sendiri pun memungkinkan
    https://tiddlywiki.com/

    • Sebagai catatan, orang yang pertama membuat TiddlyWiki itu adalah saya
      Konfigurasi single-file yang Anda sebut sudah punya beberapa konektor LLM. Misalnya https://github.com/rimir-cc/tw-llm-connect
      Daya tariknya memang tepat di situ. Tidak ada dependensi, tidak perlu instalasi, dan sangat mudah disimpan, jadi konfigurasi wiki agentic satu file yang mengedit dirinya sendiri sudah bisa dilakukan hari ini juga
      Yang lebih dekat ke pola LLM Wiki ala Karpathy, saya juga sedang mengerjakan twillm
      https://github.com/Jermolene/twillm
      Ini memakai konfigurasi Node.js milik TiddlyWiki, menyimpan tiddler sebagai file terpisah, sehingga bisa langsung menunjuk ke vault Markdown yang sudah ada dan dipakai bersama alat seperti Claude Code
      Kelebihan TiddlyWiki juga cukup jelas. Karena open source, ia bisa terus dipakai dalam jangka panjang, dan karena berbasis web, ia bisa diakses dari mana saja
      Selain itu, computed view menggantikan file indeks materialized. Dalam pendekatan Karpathy, LLM harus terus menyinkronkan index.md setiap kali menambahkan catatan, dan hal seperti ini mudah menjadi stale setiap kali sesi berganti, yang justru sangat tidak dikuasai LLM
      Sebaliknya, view TiddlyWiki adalah ekspresi filter real-time, sehingga misalnya hasil seperti "tiddler bertag concept diurutkan berdasarkan rating" dihitung langsung saat render
      Frontmatter juga menjadi struktur yang bisa di-query. Obsidian menampilkan YAML frontmatter sebagai metadata berbentuk kotak di bagian atas catatan, sedangkan TiddlyWiki mengangkat field itu menjadi field tiddler kelas satu yang bisa langsung dipakai untuk filter, sortir, dan agregasi
      Dan LLM tidak hanya bisa menulis konten, tetapi juga applet kecil. Selain catatan Markdown, ia bisa menambahkan tiddler wikitext (.tid) untuk membuat live view interaktif seperti dashboard, alat penjelajah tag, indeks jurnal, atau glosarium
  • Area self building artefacts menarik, dan belakangan ini sedang tumbuh besar seiring LLM, terutama model coding, cepat sekali makin kuat di sini
    Saya juga baru-baru ini bereksperimen dengan proyek yang berfokus pada minim dependensi dan pengendalian agen secara lokal
    https://github.com/GistNoesis/Shoggoth.db/
    Untuk menjalankan tugas jangka panjang yang diberikan lewat prompt, sistem ini membuat dan merapikan database sqlite sendiri, dan memakai salinan Wikipedia lokal sebagai data sumber
    Saya juga hanya menaruh harness dan alat yang sangat minimal untuk bereksperimen dengan drift agen
    Menambahkan alat pemrosesan gambar juga cukup mudah. Gambar tinggal di-encode ke base64 lalu dikirim ke llama.cpp, dan detail implementasinya pun bisa asal divibecoding dengan LLM lokal
    Menurut saya ini alat yang cukup berguna secara umum
    Misalnya dulu saya punya skrip yang memakai Amazon Textract untuk mengekstrak nominal, tanggal, dan penjual dari faktur dan kuitansi dalam folder, lalu setelah itu angka-angkanya dicek manusia untuk membuat CSV yang akan diberikan ke akuntan
    Sekarang panggilan Amazon Textract itu bisa diganti dengan pemanggilan model llama.cpp dengan prompt yang tepat, sambil tetap mempertahankan alat faktur yang sudah ada dan sekaligus memungkinkan pemrosesan akuntansi yang jauh lebih kreatif
    Saya juga bereksperimen dengan variasi yang menggerakkan robot fisik dari rangkaian gambar kamera, dan untuk kasus sederhana memang benar-benar bergerak dan mencapai tujuan
    Hanya saja LLM yang saya pakai memang tidak pernah dilatih untuk mengemudikan robot, dan butuh 10 detik untuk memilih tindakan berikutnya sehingga tidak praktis. Kontroler konvensional non-deep-learning yang saya pakai saat ini menjalankan vision loop di 20Hz

  • Model LLM dan agen di atasnya bukan deterministik, melainkan probabilistik
    Mereka bisa berhasil melakukan sesuatu pada persentase tertentu, tetapi tidak selalu berhasil setiap kali
    Karena itu, makin lama agen mempertahankan satu tugas, makin besar pula peluang gagalnya. Agen jangka panjang seperti ini pada akhirnya akan gagal, dan di sepanjang prosesnya juga membakar biaya token yang sangat besar
    Salah satu hal yang dikuasai agen LLM adalah menulis ulang instruksinya sendiri
    Triknya adalah membatasi waktu dan langkah berpikir model thinking, lalu mengevaluasi, memperbarui, dan menjalankannya lagi
    Analogi sederhananya, anggap saja agen itu mudah jatuh. Jangan buat dia berlari terlalu lama sampai jatuh; dua kali 5 menit lebih baik daripada sekali 10 menit
    Dalam beberapa minggu, agen swa-rujuk seperti ini kemungkinan akan memenuhi bagian atas feed Twitter semua orang

    • Agen dan ML juga punya masalah terjebak di local maxima jika tidak ada umpan balik eksternal
      Jadi wiki seperti ini kemungkinan besar akan mencapai suatu keadaan lalu berhenti di sana