1 poin oleh anima 4 jam lalu | 1 komentar | Bagikan ke WhatsApp

Halo. Saya Junghoo, sedang belajar coding sambil bereksperimen langsung dengan runtime agen AI.

SongRyeon Core adalah eksperimen kecil local-first (agent runtime) yang menangani secara terpisah “penilaian yang dikatakan LLM” dan “fakta yang benar-benar diverifikasi oleh kode”.

Belakangan ini, saat membuat agen berbasis LLM, saya merasa masalah berikut cukup sering muncul.

  • Konten yang ditebak LLM ditampilkan seolah-olah sebagai fakta sistem
  • Fallback atau heuristik yang dibuat kode tercampur seolah-olah merupakan penilaian LLM
  • Berapa dokumen yang dibaca dan eksekusi apa yang benar-benar terjadi terlihat berbeda di tiap layar
  • Jawaban akhir tidak selaras dengan status runtime internal

Karena itu, dalam proyek ini informasi dibagi dan ditangani secara besar menjadi tiga jenis.

  • Informasi absolut: nilai yang dapat diverifikasi melalui code/trace/schema/tool result
  • Informasi relatif: penilaian LLM yang berkorespondensi dengan satu informasi absolut
  • Informasi campuran: penilaian LLM berdasarkan beberapa source bundle

Saat ini ini masih sebatas versi latihan kecil, tetapi saya sedang bereksperimen dengan struktur seperti berikut.

  • node_0 memory supplier
  • node_1 router
  • L loop
  • node_3 reporter
  • node_4 verifier
  • verifikasi regresi berbasis smoke-test
  • pemeriksaan kejujuran runtime terminal/final renderer

Tujuannya bukan membuat “demo yang keren”, melainkan mencoba membuat runtime kecil yang sebisa mungkin tidak menyembunyikan atas dasar apa agen AI mengatakan sesuatu.

Saya masih dalam proses belajar coding, jadi masih banyak bagian yang kasar.
Saya akan sangat berterima kasih jika Anda bisa memberi masukan tentang struktur, README, pengujian, definisi istilah, dan desain agent runtime.

GitHub:
https://github.com/Junghoo-developer/SongRyeon

1 komentar

 
anima 4 jam lalu

Sebagai tambahan.

Saat ini SongRyeon Core lebih merupakan eksperimen runtime yang berfokus pada CLI lokal / smoke-test, bukan dalam bentuk layanan web.

Yang bisa langsung dicoba adalah cara menjalankan di README:

  • python -m compileall songryeon_core main.py
  • python main.py smoke-test

Secara khusus, bagian yang ingin saya minta masukan adalah berikut ini.

  • Apakah pemisahan antara informasi absolut / informasi relatif / informasi campuran masuk akal secara desain
  • Apakah cara memisahkan penilaian LLM dan code-verified fact terlihat berguna dalam agent runtime yang sebenarnya
  • Bagian mana di README yang sulit dipahami oleh orang yang baru pertama kali melihatnya

Ini masih proyek yang sedang saya pelajari, jadi masih banyak bagian yang kasar. Saya akan sangat berterima kasih jika Anda bisa memberi masukan dengan bebas.