legalQ – chatbot publik untuk menanyakan hukum dan preseden Korea dalam bahasa alami
(legalq.dnotitia.ai)Saya membagikan legalQ, chatbot publik yang memungkinkan pengguna menanyakan hukum dan preseden Korea dengan bahasa alami.
Saya adalah engineer yang terlibat dalam pengembangan legalQ di Dnotitia. Terpisah dari pengumuman resmi perusahaan, saya membagikannya lewat akun pribadi karena ingin mendapatkan masukan teknis dari para pengguna GeekNews.
Hukum dan preseden sering kali sulit dicari hanya dengan kata kunci. Sebaliknya, jika langsung ditanyakan ke LLM umum seperti ChatGPT atau Claude, memang nyaman, tetapi nomor pasal atau kutipan preseden bisa menjadi tidak akurat.
legalQ bekerja berbasis RAG untuk mengurangi masalah tersebut. Pertanyaan bahasa alami dari pengguna diubah ke bentuk yang cocok untuk pencarian, lalu data hukum dan preseden yang relevan dicari, dan sebisa mungkin informasi pasal serta preseden yang dijadikan rujukan juga ditampilkan bersama jawaban.
Data yang digunakan didasarkan pada legalize-kr, yang belum lama ini diperkenalkan di GN.
Saat ini, pemrosesan data lampiran bertanda bintang di bawah ini masih belum memadai. Karena itu, untuk pertanyaan yang inti jawabannya bergantung pada isi lampiran tersebut, alih-alih mengandalkan jawaban saja, sistem menanganinya dengan menampilkan tautan ke hukum terkait.
Perbedaan dibanding pendekatan yang ada
- Layanan pencarian hukum dan preseden yang sudah ada
Mereka kuat dalam pencarian berbasis kata kunci, tetapi dalam beberapa kasus kurang nyaman untuk mengajukan pertanyaan dengan menjabarkan situasi pengguna dalam bahasa alami. - Langsung bertanya ke ChatGPT atau Claude
Penggunaannya nyaman, tetapi nomor pasal atau kutipan preseden bisa salah. legalQ dirancang untuk menjawab berdasarkan indeks pencarian, dan sebisa mungkin juga menampilkan informasi pasal serta preseden yang menjadi dasar jawabannya. - Alat seperti Beommang atau Korean Law MCP
Saya memahaminya sebagai alat yang lebih dekat ke lapisan API atau MCP. legalQ menargetkan UI yang bisa langsung digunakan di browser tanpa instalasi terpisah.
Stack
Backend menggunakan FastAPI, frontend menggunakan React. Pemanggilan LLM diproses melalui OpenRouter, sedangkan pencarian menggunakan data legalize-kr yang diindeks ke vector DB internal perusahaan (Seahorse Cloud).
Bagian pemanggilan tool dipisahkan dengan MCP. Pertanyaan bahasa alami diubah menjadi kueri pencarian, lalu informasi hukum dan preseden yang dibutuhkan diambil, dan berdasarkan hasil itu jawaban dihasilkan.
Privasi
Pertanyaan tentang hukum atau preseden adalah ranah yang dapat mengungkap situasi spesifik pengguna, jadi sistem dirancang dengan arah meminimalkan penyimpanan percakapan.
- Tidak ada pendaftaran anggota atau login.
- Isi percakapan tidak disimpan di DB server.
- Strukturnya stateless: pada setiap permintaan, klien mengirimkan history yang diperlukan bersama permintaan.
- Riwayat percakapan hanya tersimpan di
localStoragebrowser, dan akan terhapus jika penyimpanan browser dibersihkan. - IP hanya digunakan dalam bucket in-memory untuk rate limit.
- Metadata permintaan pada access log standar disimpan dengan rotasi per 30 hari.
- Untuk menghasilkan jawaban, kueri pengguna dapat dikirim ke API LLM.
Keterbatasan
Karena ini masih versi awal, keterbatasannya masih banyak.
- Ini bukan layanan konsultasi hukum, melainkan alat pencarian informasi umum tentang hukum dan preseden.
- Jawaban bisa salah, jadi untuk perkara penting tetap perlu memeriksa naskah hukum asli dan meninjaunya dengan ahli.
- Data lampiran masih belum tertangani dengan memadai, sehingga dalam beberapa kasus pengguna diarahkan ke tautan hukum terkait.
- Pencarian dan kutipan preseden dapat terlewat atau tidak akurat tergantung cakupan data dan kualitas pencarian.
- Untuk pertanyaan yang perlu merujuk beberapa informasi hukum sekaligus, tool call bisa bertambah banyak sehingga jawaban menjadi lambat atau sebagian informasi terlewat.
Masukan yang ingin saya terima
Karena ini rilis awal, saya ingin banyak mendengar kekurangannya. Khususnya, masukan seperti berikut akan sangat membantu.
- Jawaban untuk pertanyaan tertentu terasa aneh
- Kutipan pasal atau preseden salah
- Gagal menemukan hukum terkait dengan benar
- Ada bagian UX yang terasa menghambat
- Ada sudut pandang yang kurang jika dibandingkan dengan layanan atau alat yang sudah ada
- Terlihat ungkapan yang bisa menjadi usang seperti layaknya nasihat hukum
Silakan dicoba, dan saya akan sangat berterima kasih atas masukan yang tajam.
Terima kasih sudah membaca.
2 komentar
Saya juga pernah mencoba membuat layanan serupa di bidang perpajakan, jadi senang melihat ini.
Saya mencoba mengajukan pertanyaan tentang pajak penghasilan badan dan Undang-Undang Pembatasan Pajak Khusus terkait kredit pajak investasi, dan saya memastikan bahwa jawabannya merujuk pada peraturan serta pasal yang benar. Saya juga terkesan karena saat menjawab, sistem ini menampilkan teks asli secara langsung dan menjelaskannya dengan membaginya berdasarkan kasus jika memungkinkan.
Jika Anda berencana memperluasnya ke bidang perpajakan, di bidang ini interpretasi administratif dari Kementerian Strategi dan Keuangan, Badan Pajak Nasional, serta Tax Tribunal, termasuk putusan sengketa pajak, pedoman, dan jawaban atas pertanyaan, sering kali memberikan informasi yang lebih rinci (biasanya layanan perpajakan sudah memasukkan materi tersebut sebagai bagian penting dari corpus), jadi akan lebih baik jika bagian itu juga dilengkapi.
Terima kasih atas masukan dan informasi berharganya!
Sepertinya data di bidang perpajakan juga tidak mudah.
Kami akan mencari cara untuk melengkapinya.