RUNE-BOT: Agen AI Lokal yang Belajar dari Kegagalan sebagai Aturan
(github.com/dybala-21)Saya sedang membuat rune, asisten AI serbaguna yang berjalan secara lokal.
Intinya bukan "agen yang menumpuk memori", melainkan arsitektur self-improving yang menggeneralisasi kegagalan menjadi aturan, lalu menyesuaikan perilakunya sendiri sambil memverifikasi aturan tersebut dalam pekerjaan nyata.
Self-Improving: membuat aturan dari kegagalan, lalu memverifikasi aturan itu lagi
eksekusi → pencatatan → deteksi pengulangan kegagalan → pembuatan kandidat aturan → verifikasi pada task terkait → promosi atau pembuangan
Jika agen mengulangi jenis kegagalan yang sama, pola tersebut dijadikan satu kandidat aturan pencegahan. Aturan ini tidak langsung dimasukkan ke prompt. Aturan dimulai dengan tingkat kepercayaan rendah, lalu hasilnya hanya dilacak pada task yang relevan setelahnya. Hanya aturan yang membantu yang akan dipromosikan secara bertahap, sedangkan aturan yang tidak efektif akan lebih cepat dikurangi nilainya hingga hilang.
Semua task disimpan sebagai episode, dan hasil sukses/gagal dicatat. Saat mengerjakan pekerjaan yang mirip, episode masa lalu akan diambil untuk dijadikan referensi.
Proactive: bergerak lebih dulu sebelum diminta
Sistem akan memberi saran lebih dulu sebelum pengguna memintanya. Jika mendeteksi sinyal frustrasi dalam alur kerja (kegagalan berulang, pembatalan cepat, akumulasi error), sistem akan menawarkan bantuan, dan jika pola kegagalan berulang terdeteksi, sistem otomatis membuat aturan pencegahan.
Namun, sistem tidak akan asal menyela. Jika pengguna menolak saran, umpan balik itu akan dilacak. Jika ditolak 5 kali dalam 30 menit, frekuensi intervensi akan otomatis diturunkan dan ambang pemberian saran akan dinaikkan. Sistem proaktif itu sendiri menyesuaikan diri berdasarkan reaksi pengguna.
Hal-hal yang bisa dilakukan agen
- membaca/menulis/mengedit/mencari file, menjalankan perintah shell
- otomatisasi browser — berpindah halaman, klik, input, screenshot, ekstraksi teks
- pencarian web (DuckDuckGo/Brave) dan scraping URL
- analisis kode — pelacakan simbol berbasis tree-sitter, pencarian definisi/referensi, analisis dampak perubahan
- delegasi sub-agen — membagi pekerjaan kompleks lalu menjalankannya secara paralel
- eksekusi terjadwal berbasis cron
- integrasi server MCP — menemukan dan menjalankan tool eksternal secara otomatis
- skill kustom — pengguna bisa membuat dan mendaftarkan tool sendiri
Keamanan
Guardian lebih dulu memblokir tindakan berisiko, Completion/Evidence Gate memeriksa apakah sistem "benar-benar sudah membaca, menulis, dan memverifikasi", dan Quality Gate menyaring respons sukses tanpa isi atau penyembunyian error. Sistem keamanannya bukan fail-open, melainkan fail-closed.
Local-first
Semua memori jangka panjang menggunakan file markdown sebagai source of truth. SQLite dan FAISS hanyalah cache pencarian, dan kapan pun bisa dibangun ulang dari markdown. Pengguna bisa membukanya langsung, mengeditnya, dan mengelola versinya dengan git.
Antarmuka
- CLI + terminal UI berbasis Rich
- multi-channel: Telegram, Discord, Slack, LINE, WhatsApp, Google Chat, Mattermost
- Web
Stack teknologinya adalah Python 3.13+, litellm, APSW(WAL), FAISS HNSW, tree-sitter, structlog. Melalui litellm, sistem ini tidak terikat pada vendor model tertentu dan dapat dihubungkan ke LLM apa pun.
Belum ada komentar.