Kabar pembaruan legalize-kr - penambahan aturan administratif/peraturan daerah, CLI/MCP/Skill, halaman ekosistem, dan lainnya
(github.com/legalize-kr)Setelah sebelumnya diperkenalkan lewat Show GN, saya merangkum dan membagikan kabar pembaruan proyek legalize-kr selama 1 bulan (31 hari) terakhir. Berkat perhatian dan dukungan dari banyak orang, saya bisa memperbaiki banyak hal. Terima kasih!
Apa itu legalize-kr?
legalize-kr adalah proyek yang mengarsipkan peraturan perundang-undangan dan putusan pengadilan Korea Selatan yang disediakan oleh Layanan Pemanfaatan Bersama Informasi Peraturan Nasional dari Kementerian Legislasi Pemerintah dalam bentuk Markdown + riwayat Git. Semua peraturan diarsipkan sebagai dokumen Markdown, semua riwayat revisi diarsipkan sebagai Git Commit, dan putusan pengadilan juga diarsipkan sebagai dokumen Markdown beserta Git History berdasarkan tanggal putusan.
Mengapa proyek ini dibuat?
Pada 30 Maret lalu, saya menemukan proyek bernama legalize.dev di GitHub Trending, yang mengelola peraturan di Spanyol dan negara-negara berbahasa Inggris dengan Markdown dan Git Commit. Saya pikir pasti sudah ada juga yang menangani peraturan Korea, tetapi setelah dicari ternyata belum ada. Rasanya akan bagus jika ada setidaknya satu proyek seperti itu, jadi saya membuatnya.
Pembaruan 1. Penambahan repositori aturan administratif / peraturan daerah
Sebelumnya proyek ini hanya menangani peraturan dan putusan pengadilan, tetapi sekarang aturan administratif dan peraturan daerah yang juga disediakan oleh layanan informasi peraturan nasional yang sama telah ditambahkan sebagai repositori terpisah. Kini dokumen hukum publik utama di Korea Selatan dapat dilacak di satu tempat dalam bentuk Markdown + Git History:
- Repositori peraturan: github.com/legalize-kr/legalize-kr
- Repositori putusan pengadilan: github.com/legalize-kr/precedent-kr
- Repositori aturan administratif: github.com/legalize-kr/admrule-kr
- Repositori peraturan daerah: github.com/legalize-kr/ordinance-kr
Aturan administratif mencakup instruksi, pedoman, pemberitahuan, dan sejenisnya dari tiap kementerian atau lembaga, sedangkan peraturan daerah mencakup perda dan aturan pemerintah daerah. Jumlahnya lebih banyak daripada peraturan umum dan revisinya juga cenderung lebih sering, jadi saya merasa nilainya cukup besar jika dilacak dengan Git History. Namun, untuk aturan administratif, melacak perubahan nama kementerian/lembaga atau pembagian perannya cukup rumit. Meski sudah diperbaiki berkali-kali, sepertinya masih ada jalan yang cukup panjang. Saya mohon perhatian dan partisipasi dari banyak orang T_T
Pembaruan 2. Penambahan alat CLI, MCP, dan Agent Skill
Menggunakan seluruh repositori dengan git clone memang paling nyaman dan ideal, tetapi mengunduh repositori berukuran puluhan GB setiap kali bisa terasa memberatkan, jadi saya membuat alat CLI berbasis GitHub REST API. Selain itu, dari codebase yang sama, saya juga menyediakan server MCP dan menambahkan Agent Skill yang bisa langsung digunakan di Claude Code / Codex dan lain-lain:
- Repositori CLI / MCP: github.com/legalize-kr/cli-tools
- Repositori Agent Skills: github.com/legalize-kr/agent-skills
Tanpa perlu mengunduh seluruh repositori, Anda bisa mencari peraturan/putusan tertentu, melihatnya per pasal, atau melacak riwayat revisinya, dan melalui MCP, LLM/Agent juga bisa memanggilnya secara langsung. AGENT SKILL juga menyertakan panduan tentang kapan sebaiknya menggunakan CLI / MCP / git clone / akses GitHub langsung dalam situasi tertentu. Namun, GitHub REST API tanpa autentikasi tambahan hanya mengizinkan hingga 60 permintaan per jam, sehingga jika diperlukan Anda perlu menerbitkan dan menggunakan GitHub token (hingga 5.000 permintaan per jam).
Pembaruan 3. Penambahan halaman use case / ekosistem
Karena mulai bermunculan sedikit demi sedikit proyek yang menggunakan dataset yang disediakan oleh legalize-kr, saya mulai merangkumnya di bagian bawah halaman utama situs web dan di menu 'Cara Menggunakan'. Selain proyek yang saya gunakan sendiri, saya juga memperkenalkan proyek atau alat lain dengan tujuan serupa (Beommang, Korean Law MCP, dan lain-lain) yang sebelumnya juga pernah diperkenalkan di GN.
Jika Anda sedang menggunakan satu atau lebih dataset dari legalize-kr, atau memiliki proyek yang bekerja di area serupa, beri tahu saya lewat PR, issue, atau komentar pada tulisan ini, dan saya akan merangkumnya bersama.
Pembaruan 4. Perbaikan lain untuk pemanfaatan data yang lebih baik
Dengan merujuk pada issue di berbagai repositori, saya sedang menata aturan parsing data serta metadata dan hal-hal terkait. Perubahan utamanya adalah sebagai berikut:
- Penyempurnaan aturan parsing untuk unit tambahan seperti 'paragraph' dan 'subsection' selain struktur yang sudah ada seperti 'part/chapter/section/subsection' (legalize-kr/legalize-kr#32)
- Perbaikan hilangnya pola
<제M조의 N>(legalize-kr/legalize-kr#31 dan legalize-kr/legalize-pipeline#2) - Pelengkapan peraturan yang sebelumnya hilang - misalnya Kitab Undang-Undang Hukum Dagang dan peraturan pelaksanaannya (legalize-kr/legalize-kr#9)
- Perbaikan masalah ketika file aturan pelaksanaan sebelum revisi masih tersisa sehingga
git logtercatat sebagai 'penambahan' alih-alih 'perubahan' (legalize-kr/legalize-kr#24) - Perubahan nama file putusan pengadilan dan pengelompokan direktori berdasarkan tanggal putusan (legalize-kr/precedent-kr#4)
- Perbaikan format alamat berbahasa Korea yang rusak pada URL sumber putusan pengadilan (law.go.kr 404) (legalize-kr/precedent-kr#3)
- Pelengkapan 17 Git Commit yang sebelumnya terlewat untuk tanggal putusan dengan era Dangi (檀紀) (legalize-kr/precedent-kr#1)
- Penambahan tautan file lampiran terkait tiap peraturan / putusan pengadilan / aturan administratif / peraturan daerah ke Markdown Frontmatter dalam bentuk List
Detail lebih lanjut dapat dilihat di closed issue dari repositori utama berikut:
- Closed issue legalize-kr: https://github.com/legalize-kr/legalize-kr/…
- Closed issue precedent-kr: https://github.com/legalize-kr/precedent-kr/…
- Closed issue legalize-pipeline: https://github.com/legalize-kr/legalize-pipeline/…
Terakhir
Awalnya saya berpikir, "kalau dibuat saja, nanti pasti ada yang memakai," tetapi setelah Show GN sebelumnya, dengan banyaknya ⭐ dan issue yang masuk, cakupannya secara alami semakin meluas. Proyek ini terus saya pelihara dan kelola secara konsisten, jadi saya mohon perhatian, dukungan, dan bantuan menyebarkannya. Terima kasih!
2 komentar
Di kementerian kami ada yang sedang mengembangkan RAG. Kami ingin meng-clone ini lalu mengekstrak dan menggunakan hanya peraturan perundang-undangan yang terkait dengan pihak kami.
Apakah itu memungkinkan?
Ya, saya belum tahu bagaimana pipeline saat ini disusun, tetapi pada dasarnya sepertinya Anda bisa menambahkan tugas-tugas terkait sebelum memasukkan dokumen ke Vector DB untuk konfigurasi RAG saat ini.
Namun, tampaknya kuncinya adalah bagaimana Anda mengekstrak 'peraturan terkait'; Anda mungkin bisa mencoba memfilternya berdasarkan nama peraturan atau kata-kata kunci utama, dan sebagainya. ^^;
Terima kasih!