ProofOfThought: Penalaran berbasis LLM dengan pembuktian teorema Z3
(github.com/DebarghaG)- ProofOfThought menggabungkan large language model (LLM) dan pembukti teorema Z3 untuk mendukung penalaran yang kuat dan dapat diinterpretasikan
- Proyek ini memberikan hasil penalaran yang akurat dan andal untuk kueri bahasa alami
- Melalui API Python tingkat tinggi, pengembang dapat dengan mudah mengimplementasikan dan bereksperimen dengan tugas penalaran yang kompleks
- Melalui Z3DSL, tersedia juga akses DSL tingkat rendah berbasis JSON sehingga memungkinkan kustomisasi yang fleksibel
- Publikasi di Sys2Reasoning Workshop NeurIPS 2024 menunjukkan manfaat praktis dari penerapan hasil riset terbaru
Pengenalan proyek open source ProofOfThought
ProofOfThought adalah pustaka penalaran open source yang mengadopsi pendekatan sintesis program neurosimbolik (neural-symbolic) yang menggabungkan large language model (LLM) dan pembukti teorema Z3. Kemampuannya untuk memberikan hasil penalaran yang tangguh dan dapat diinterpretasikan terhadap masalah kompleks di dunia nyata memiliki makna penting baik untuk penggunaan praktis maupun penelitian.
Karena bersifat open source, siapa pun bebas memanfaatkannya untuk riset, layanan, maupun pengembangan. Dibandingkan sistem penalaran berbasis LLM yang sederhana, keunggulannya adalah proses penalaran lebih mudah diverifikasi dan kesalahan lebih mudah diinterpretasikan. Ciri pembeda utamanya dibanding sistem penalaran lain adalah transparansi struktural berupa alur input bahasa alami → konversi otomatis ke program logika → penalaran berbasis Z3.
Arsitektur sistem dan komponen utama
-
API tingkat tinggi (
z3dsl.reasoning) :- Menjalankan kueri penalaran berbasis bahasa alami
- Menyediakan antarmuka Python yang mudah digunakan bahkan oleh pemula
-
DSL tingkat rendah (
z3dsl) :- Memungkinkan akses ke pembukti teorema Z3 berbasis JSON
- Menguntungkan untuk kustomisasi kompleks dan pembangunan pipeline otomatis
Contoh fitur utama
-
LLM mengubah kueri yang diberikan menjadi formula logika (program simbolik)
-
Melalui pembukti Z3, menghasilkan hasil interpretasi benar/salah (
yes/no) atau berbasis kondisi -
Contoh:
- Kueri: "Apakah Nancy Pelosi akan secara terbuka mengecam aborsi?"
- Hasil: False (tidak)
-
Menyediakan pipeline evaluasi (
EvaluationPipeline):- Mendukung evaluasi batch untuk dataset dalam jumlah besar
- Pelaporan otomatis seperti akurasi
Penerapan dan contoh penggunaan
- Otomatisasi benchmark penalaran untuk tujuan riset
- Layanan pembuktian otomatis untuk knowledge graph berbasis LLM atau masalah logika tingkat tinggi
- Berpotensi diterapkan pada berbagai layanan AI seperti kueri kebijakan yang kompleks dan penentuan otomatis atas debat bahasa alami
Signifikansi dan karakteristik riset
- Dipresentasikan di workshop Sys2Reasoning pada NeurIPS 2024
- Keandalan berbasis interpretasi simbolik yang melengkapi keterbatasan LLM yang ada (ketidakpastian penalaran)
- Transparansi hasil penalaran dan dasar pembuktiannya menjadi keunggulan besar dalam pengembangan layanan nyata
Kesimpulan
ProofOfThought menggabungkan keunggulan LLM dan pembukti teorema Z3 untuk memberikan nilai nyata bagi pengembang dan peneliti yang ingin membangun infrastruktur penalaran AI yang tangguh dan dapat diinterpretasikan. Lisensi dan strukturnya dirancang agar sesuai dengan ekosistem open source, sehingga menarik baik untuk penelitian akademik maupun pemanfaatan industri.
1 komentar
Komentar Hacker News
sympyPython. Ia membagikan kesan bahwa gabungan antara LLM yang ambigu dan alat yang ketat bisa menghasilkan efek yang kuat