DeepEval - Pengujian unit untuk LLM

xguru · 2023-08-19T10:03:01+09:00

Filosofi dasarnya adalah "Pytest for LLM" Untuk beralih ke produksi, menyediakan cara yang Pythonic untuk menjalankan evaluasi offline terhadap pipeline LLM Memungkinkan penulisan pengujian untuk aplikasi LLM (seperti RAG) layaknya menulis unit test Python Melalui assert_llm_output, jawaban dievaluasi dengan metrik seperti entailment / exact / bertscore Juga memungkinkan pengaturan metrik kustom serta modifikasi metrik yang sudah ada

(github.com/mr-gpt)

4 poin oleh xguru 2023-08-19 | Belum ada komentar. | Bagikan ke WhatsApp

Filosofi dasarnya adalah "Pytest for LLM"
Untuk beralih ke produksi, menyediakan cara yang Pythonic untuk menjalankan evaluasi offline terhadap pipeline LLM
Memungkinkan penulisan pengujian untuk aplikasi LLM (seperti RAG) layaknya menulis unit test Python
Melalui assert_llm_output, jawaban dievaluasi dengan metrik seperti entailment / exact / bertscore
Juga memungkinkan pengaturan metrik kustom serta modifikasi metrik yang sudah ada

DeepEval - Pengujian unit untuk LLM

Bacaan terkait

Belum ada komentar.