LangChain merilis Skills, cara meningkatkan tingkat keberhasilan Claude Code dari 25% menjadi 95%
(aisparkup.com)LangChain merilis rangkaian "Skills" yang secara dramatis meningkatkan performa agen coding.
Khususnya saat model seperti Claude Code mengerjakan tugas terkait LangChain/LangGraph/LangSmith, tingkat keberhasilan yang sebelumnya hanya sekitar 25% tanpa Skills naik hingga 95% setelah Skills diterapkan, dan tugas terkait LangSmith juga meningkat besar dari 17% → 92%.
Jenis Skills yang dirilis
- 11 Skills LangChain: loop dasar agen, Human-in-the-Loop di LangGraph, Deep Agents, dan lain-lain
- 3 Skills LangSmith: tracing, pembangunan dataset, evaluasi agen
→ LangSmith CLI juga dirilis bersamaan (bisa melihat trace, mengelola dataset, dan menjalankan eksperimen dari terminal)
Hasil evaluasi & pelajaran
- Saat menggunakan Skills, tingkat penyelesaian Claude Code 82% vs 9% tanpa Skills
- Akurasi pemanggilan Skills: jika terlalu banyak (20), salah operasi ↑ → jika dikurangi ke sekitar 12, akurasi ↑
- Agar efeknya maksimal, perlu panduan yang jelas di AGENTS.md atau CLAUDE.md tentang “kapan harus memakai Skills tertentu”
Prospek ke depan
- Dengan memanfaatkan Skills LangSmith, agen bisa menjalankan loop perbaikan diri berupa menganalisis log eksekusinya sendiri → merangkum masalah → otomatis membuat evaluator+dataset pengujian.
- Ke depan, kemungkinan siklus berbasis terminal di mana “agen meningkatkan agen” akan menjadi arus utama.
Belum ada komentar.