18 poin oleh chohi 2026-05-03 | 3 komentar | Bagikan ke WhatsApp

Membangun sLLM khusus domain pemerintah — molit-gemma + RAG

Ini adalah contoh pembangunan chatbot khusus domain secara on-premise di lingkungan keamanan publik yang sulit menggunakan LLM eksternal seperti ChatGPT/Claude.

TL;DR

  • Fine-tuning Google Gemma-3-1B dengan dokumen kebijakan Kementerian Pertanahan, Infrastruktur, dan Transportasi → molit-gemma
  • Mengurangi halusinasi dengan RAG berbasis OpenSearch
  • BLEU 0.6258, LLM-as-a-Judge 4.34/5.0
  • Deployment sepenuhnya on-premise (API eksternal 0)

Mengapa sLLM

  • Respons pengaduan warga di pemerintahan berisiko mengalami kebocoran data saat memanggil API eksternal
  • Model kelas 70B membebani infrastruktur GPU → dilengkapi dengan model 1B + RAG
  • Fine-tuning khusus domain memberikan akurasi lebih baik daripada LLM umum

Arsitektur

Pertanyaan pengguna → pencarian OpenSearch → dokumen kebijakan Top-K → respons dibuat oleh molit-gemma → kutipan sumber

Implikasi

  • Menyajikan baseline empiris untuk kombinasi sLLM + RAG di sektor publik
  • Bahkan model 1B dapat mencapai tingkat praktis jika domainnya dibatasi
  • Mengurangi halusinasi + memastikan kemampuan penjelasan

Tautan

3 komentar

 
danke1 2026-05-05

Menarik, terima kasih sudah berbagi.

 
hosungseo2026 2026-05-04

Keren sekali

 
jhk0530 2026-05-03

Selamat atas disertasinya!