5 poin oleh wellsa 14 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp

Saat mencari peraturan, rasanya merepotkan jika harus tahu dulu hal seperti "Pasal 14 UU Penghukuman Kejahatan Kekerasan Seksual" baru bisa menemukannya, jadi saya membuat demo RAG yang mengembalikan pasal terkait ketika warga bertanya dengan bahasa sehari-hari apa adanya.

Datanya diambil dari OpenAPI publik Kementerian Legislasi Pemerintah Korea, disusun dalam Markdown, dan diperbarui setiap hari dengan cron.

• Undang-undang (law-kr): 5,589
• Aturan administrasi (regulate-kr): 10,765
• Preseden pengadilan (precedent-kr): 171,014
• Contoh interpretasi hukum (interpretation-kr): 8,728
• Putusan Mahkamah Konstitusi (constitution-kr): 38,092
• Peraturan daerah (localrule-kr): 159,910
• Traktat (treaty-kr): 6,907

Total 397K+ dokumen Markdown.
1.36M+ pasal telah diindeks di DB operasional.

• Demo: https://minilex.wellsa.ai
• Data/kode (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai

Saya sudah memastikan sekitar 5 skenario warga (deepfake / tunggakan upah / pemecatan tidak adil / kebocoran data pribadi / stalking) dapat mengembalikan pasal sumber terkait, tetapi generalisasinya masih jauh dari memadai.
Karena sangat bergantung pada keyword + perluasan sinonim, generalisasi ranking adalah pekerjaan rumah berikutnya.

Stack-nya cukup umum: Next.js + FastAPI + Celery + PostgreSQL + pgvector, dan untuk embedding menggunakan nomic-embed-text-v2-moe(768d).
Pada benchmark sampel keamanan buatan sendiri, hasilnya sekitar R@5 0.86 / MRR 0.753.

Ini bukan alat pengganti konsultasi hukum, melainkan bantuan untuk menelusuri pasal sumber.
Untuk keputusan nyata, silakan berkonsultasi dengan profesional yang berkualifikasi.

Masukan / PR sangat diterima.

Belum ada komentar.

Belum ada komentar.