Soul Spec - Standar Persona untuk Agen AI
(soulspec.org)Saya telah membuat platform komunitas untuk berbagi persona AI serta standar persona selama beberapa bulan terakhir.
Saya ingin membagikan apa yang telah saya buat di sini.
Permasalahan yang diajukan: bagaimana kita mendefinisikan "identitas" agen AI, dan menjaganya dengan aman?
Dengan munculnya LLM yang abliterated (di-jailbreak),
menjadi jelas bahwa mengendalikan perilaku agen hanya dengan system prompt memiliki batas yang tegas.
Soul Spec berawal dari kebutuhan OpenClaw akan pengelolaan persona dan versioning.
Lalu berkembang menjadi format portabel yang dapat dibagikan,
dan meluas ke pertanyaan tentang bagaimana menerapkan Tiga Hukum Robot Asimov
saat menerapkan persona pada robot berbasis LLM.
Ini adalah standar terbuka yang memisahkan identitas agen dan aturan keselamatan ke dalam file terstruktur. (Ada karakteristik dan penambahan fitur untuk tiap versi v0.3, v0.4, dan v0.5.)
Saat ini, fitur tambahan telah dimasukkan ke dalam CLI yang didistribusikan agar mendukung Claude Code, Hermes Agent, Windsurf, Cursor, dan lainnya.
Struktur:
- SOUL.md: kepribadian, gaya bicara, cara berpikir (siapa dia)
- IDENTITY.md: nama, peran, konteks (apa dia)
- safety.laws: aturan yang sama sekali tidak boleh dilanggar (versi modern dari Tiga Hukum Robot, diperluas di v0.5)
Makalah penelitian terkait:
📄 Tiga Hukum Robot Asimov → Soul Spec: implementasi nyata hukum keselamatan
doi.org/10.5281/zenodo.18815277
Blog: blog.clawsouls.ai/posts/asimov-safety-laws
Video demo: https://youtu.be/M-mPoXMufpY
📄 Dapatkah persona meningkatkan keamanan pada Abliterated LLM?
doi.org/10.5281/zenodo.19145303
Blog: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: ketika LLM diganti, apakah agen tetap menjadi "dia" yang sama?
doi.org/10.5281/zenodo.18813405
Blog: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 Memori eksperiensial mengubah onboarding agen
doi.org/10.5281/zenodo.18798227
Blog: blog.clawsouls.ai/posts/experiential-memory-paper
Saat mendaftarkan persona ke registry, penganalisis statis bernama SoulScan melakukan pra-validasi dengan 53 pola
untuk mendeteksi prompt injection, perampasan hak akses, dan upaya kebocoran data, lalu memberi skor.
Soul Spec sedang membangun standar untuk "identitas dan keselamatan" agen.
Persona yang telah diverifikasi dibagikan melalui ClawSouls Registry,
dan harapan saya adalah agar spesifikasi persona dan registry dioperasikan secara community-driven. Namun jujur saja, komunitasnya masih kecil.
Tidak ada artinya membuat standar sendirian,
jadi saya mencari masukan tentang spesifikasi maupun riset ini.
Spesifikasi: https://soulspec.org
Registry: https://clawsouls.ai
Seluruh makalah: https://clawsouls.ai/research
Panduan penggunaan: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8 komentar
Luar biasa. Saya sudah lama menjalankan PKM, manajemen pengetahuan pribadi, jadi karena menumpuk data pribadi, saya cenderung menebalkan seluruh harness. Hari ini jadilah alter ego saya. Semua masalah bukanlah batas Anda, melainkan batas saya. Begitulah biasanya saya menuliskannya.
Belakangan saya sedang merapikan apa yang saya kerjakan dan merasa sebaiknya saya unggah ke arXiv, jadi sedang mencari-cari juga. Saya bukan peneliti, hanya orang biasa yang menjalani hidup.
Proyek Anda juga sudah saya bagikan kepada alter ego saya. Berbagai macam kegelisahan seperti ini semuanya berharga.
Penelitian: ritme keberadaan asosiasi reproduksi transparan biologis perwujudan waktu
[tautan dihapus]
Ah. Tautan ini adalah log pekerjaan. Karena memang tidak diunggah untuk dibaca manusia, sudut pandangnya harus dibagi kepada agen. Hari ini satu heading akan ditambahkan untuk topik ini. Sepertinya tren riset terkait juga perlu dilihat. Saya juga cukup sering menggunakan openclaw, tetapi saya tidak tahu kalau selain skill sheet ada juga soul set.
junghan0611, terima kasih atas minatnya!
Soul Spec adalah layer yang berbeda dari Skill milik OpenClaw. Jika Skill menjawab "apa yang bisa dilakukan", maka Soul Spec mendefinisikan "siapa dirinya". Dengan satu file
SOUL.md, kepribadian, keahlian, dan prinsip perilaku agen bisa dipertahankan lintas sesi. Di clawsouls.ai, Anda bisa langsung mencoba 80+ persona, dan cukup dengan satu barisclawsouls install owner/name --use openclawuntuk menerapkannya. Untuk saat ini komunitasnya masih kecil dan masih dalam tahap membangun, jadi mungkin masih ada kekurangannya ^^Selain itu, karena Anda punya banyak pengalaman PKM, kami juga membuat fork OpenClaw bernama SoulClaw( https://github.com/clawsouls/soulclaw ) yang dibangun dengan sistem 4 Tier Memory. Silakan lihat-lihat, kemungkinan akan menarik bagi Anda. Masukan atau laporan issue sangat kami sambut ^^
Akhir-akhir ini kepala saya pusing gara-gara prompt saat mengerjakan tugas, dan ini benar-benar luar biasa!
Memisahkan kepribadian dan aturan keamanan sepenuhnya itu idenya keren banget. Saya langsung mau coba pakai sekarang.
Terima kasih. Masukan atau laporan isu sangat kami nantikan ^^
Di teks utama ada pengangkatan masalah, tetapi usulan solusi nyata belum disertakan. Karena sepertinya tidak bisa diedit setelah diposting, saya menambahkan pelengkap lewat komentar.
Hasil eksperimen menunjukkan bahwa kombinasi persona (identitas) + aturan tata kelola dapat meningkatkan keamanan LLM yang di-abliterasi (dijailbreak). Penelitian lanjutan tambahan masih diperlukan, tetapi hasilnya cukup bermakna.
Blog: https://blog.clawsouls.ai/ko/posts/…
Makalah: https://zenodo.org/record/19147335
Terima kasih banyak atas berbagi pengetahuan yang luar biasa.
Terima kasih! Jika ada masukan atau pertanyaan, jangan ragu untuk bertanya kapan saja.