LangChain merilis Skills, cara meningkatkan tingkat keberhasilan Claude Code dari 25% menjadi 95%

(aisparkup.com)

32 poin oleh davespark 2026-03-10 | Belum ada komentar. | Bagikan ke WhatsApp

LangChain merilis rangkaian "Skills" yang secara dramatis meningkatkan performa agen coding.

Khususnya saat model seperti Claude Code mengerjakan tugas terkait LangChain/LangGraph/LangSmith, tingkat keberhasilan yang sebelumnya hanya sekitar 25% tanpa Skills naik hingga 95% setelah Skills diterapkan, dan tugas terkait LangSmith juga meningkat besar dari 17% → 92%.

Jenis Skills yang dirilis

11 Skills LangChain: loop dasar agen, Human-in-the-Loop di LangGraph, Deep Agents, dan lain-lain
3 Skills LangSmith: tracing, pembangunan dataset, evaluasi agen
→ LangSmith CLI juga dirilis bersamaan (bisa melihat trace, mengelola dataset, dan menjalankan eksperimen dari terminal)

Hasil evaluasi & pelajaran

Saat menggunakan Skills, tingkat penyelesaian Claude Code 82% vs 9% tanpa Skills
Akurasi pemanggilan Skills: jika terlalu banyak (20), salah operasi ↑ → jika dikurangi ke sekitar 12, akurasi ↑
Agar efeknya maksimal, perlu panduan yang jelas di AGENTS.md atau CLAUDE.md tentang “kapan harus memakai Skills tertentu”

Prospek ke depan

Dengan memanfaatkan Skills LangSmith, agen bisa menjalankan loop perbaikan diri berupa menganalisis log eksekusinya sendiri → merangkum masalah → otomatis membuat evaluator+dataset pengujian.
Ke depan, kemungkinan siklus berbasis terminal di mana “agen meningkatkan agen” akan menjadi arus utama.

LangChain merilis Skills, cara meningkatkan tingkat keberhasilan Claude Code dari 25% menjadi 95%

Bacaan terkait

Belum ada komentar.