2 poin oleh maantano 6 hari lalu | 2 komentar | Bagikan ke WhatsApp

URL : https://lemini-brown.vercel.app/

Kami membagikan Lemini, chatbot RAG untuk menanyakan undang-undang dan preseden hukum Korea dengan bahasa alami. Setelah melihat baru-baru ini ada tulisan tentang layanan dengan nuansa serupa, kami mengunggah ini karena kami menyelesaikan
masalah yang sama dengan dua mode berbeda dan ingin mendapatkan umpan balik teknis.

Mengapa dua mode

Pertanyaan hukum terbagi ke dalam dua jenis.

  1. "Situasi saya seperti ini, apa yang harus saya lakukan?" — pengguna tidak cukup mampu menjelaskan hubungan fakta secara terperinci. Jika diterima dengan RAG biasa, yang kembali hanya penjelasan umum.
  2. "Tolong telaah kontrak/syarat dan ketentuan ini" — dokumennya sudah ada, tetapi jika dengan satu prompt hanya diminta "tolong telaah", yang keluar hanya checklist standar.

Dua jenis ini tidak bisa diselesaikan dengan RAG yang sama. Lemini dirancang dengan membagi mode menjadi dua.


Mode 1 — Ouroboros (konvergensi hubungan fakta interaktif)

pertanyaan → [apakah hubungan faktanya sudah cukup?] ──kurang── pertanyaan lanjutan pilihan ganda ─┐
│ cukup │
▼ ←─ jawaban pengguna ┘
RAG (undang-undang+preseden+aturan otonom)

analisis terstruktur
· fakta yang menguntungkan/perlu diwaspadai
· rencana tindakan
· peringatan tenggat waktu (daluwarsa)
· preseden terkait

loop verifikasi sitasi — menghapus sitasi yang tidak ada dalam hit pencarian

Ringkasan inti: sebelum menjawab, model terlebih dahulu bertanya pada dirinya sendiri, "apakah hubungan faktanya sudah cukup?"

Jika kurang, ia memberi pertanyaan lanjutan berbentuk kartu pilihan ganda; jika cukup, lanjut ke RAG → analisis terstruktur. Pengguna tidak perlu merancang sendiri pertanyaan lanjutan.


Mode 2 — Analisis profesional (6 chain telaah dokumen)

input dokumen

① pemindaian keseluruhan — sifat dokumen, ringkasan bagian
② pemetaan frame sistem eksternal — deklarasi sistem yang menjadi sandaran dokumen ini
③ RAG per sumbu — pencarian undang-undang dan preseden untuk tiap sumbu sistem
② pemetaan frame sistem eksternal — deklarasi sistem yang menjadi sandaran dokumen ini
③ RAG per sumbu — pencarian undang-undang dan preseden untuk tiap sumbu sistem
④ telaah per klausul — observations / gaps / external
⑤ chain paralel (3 berjalan bersamaan)
├ keselarasan tujuan-sarana
├ telaah dari sisi sistem
└ skenario risiko
⑥ verdict berbasis penilaian — hanya untuk pertanyaan yang bersifat judgment

Ringkasan inti: alih-alih satu prompt "tolong telaah", kami "lebih dulu mendeklarasikan frame sistem di luar dokumen, lalu masuk."

Langkah ② ini tidak keluar dengan baik lewat satu prompt, jadi chain-nya dipisah.


Fondasi bersama yang menopang dua mode

  • loop verifikasi sitasi — sitasi yang ditulis LLM dibandingkan dengan hit pencarian, lalu sitasi yang tidak ada dihapus dari respons. Mencegah pasal palsu yang tampak meyakinkan.
  • satu pool yang sama untuk 3 jenis data — undang-undang + preseden + aturan otonom (syarat dan ketentuan standar Fair Trade Commission, aturan asosiasi, pedoman KISA dan Personal Information Protection Commission) dimuat ke ruang vektor yang sama.
    Tidak ada percabangan domain di kode, dibedakan hanya dengan document_type.
  • pipeline pengumpulan internal — undang-undang diperbarui otomatis seminggu sekali lewat DRF API, preseden menggunakan National Law Information shared-use API + cache on-demand.
  • prompt diprioritaskan untuk generalitas. Informasi untuk menghasilkan jawaban tidak diberikan secara langsung; prompt dirancang agar menghasilkan jawaban yang sesuai dengan pertanyaan.

Stack

FastAPI / Cloud Run · Next.js · Gemini (JSON terstruktur + multi-chain) · SQLite + matriks embedding internal (3 sumbu: vektor·lexical·exact)

Privasi

Tanpa pendaftaran atau login, tanpa penyimpanan percakapan di DB server (browser localStorage), stateless, IP hanya digunakan di memori untuk rate limit.

Batasan

Ini adalah alat pencarian dan analisis informasi, bukan nasihat hukum. Ada kekosongan pada data lampiran/formulir dan cakupan preseden. Kemampuan penalaran model itu sendiri
bergantung pada LLM eksternal, dan titik diferensiasi yang ingin kami tonjolkan bukanlah "jawaban yang terdengar meyakinkan", melainkan "jawaban terstruktur dengan dasar yang tervalidasi".

Umpan balik yang ingin kami dapatkan

  • Mode 1 — kasus ketika pertanyaan lanjutan Ouroboros melenceng atau berlebihan
  • Mode 2 — sudut pandang yang terlewat dalam 6 chain telaah dokumen
  • sitasi salah yang tidak tertangkap oleh loop verifikasi sitasi
  • sudut pandang yang kurang dibanding layanan lain di domain yang sama

Silakan coba, dan kami akan berterima kasih atas umpan balik yang tajam.

2 komentar

 
dydwls140 6 hari lalu

Hasil peninjauan dokumen
Gagal dikonfirmasi
Terjadi kesalahan saat peninjauan dokumen. Saat menggunakan chatbot muncul error, dan ketika saya mencari nama peraturan, yang pertama muncul 50% tetapi sisanya tampaknya skor yang tidak masuk akal seperti 4565%.

 
maantano 5 hari lalu

Terima kasih!! 😭 Saya akan coba cek!!