32 poin oleh davespark 2026-03-10 | Belum ada komentar. | Bagikan ke WhatsApp

LangChain merilis rangkaian "Skills" yang secara dramatis meningkatkan performa agen coding.

Khususnya saat model seperti Claude Code mengerjakan tugas terkait LangChain/LangGraph/LangSmith, tingkat keberhasilan yang sebelumnya hanya sekitar 25% tanpa Skills naik hingga 95% setelah Skills diterapkan, dan tugas terkait LangSmith juga meningkat besar dari 17% → 92%.

Jenis Skills yang dirilis

  • 11 Skills LangChain: loop dasar agen, Human-in-the-Loop di LangGraph, Deep Agents, dan lain-lain
  • 3 Skills LangSmith: tracing, pembangunan dataset, evaluasi agen
    → LangSmith CLI juga dirilis bersamaan (bisa melihat trace, mengelola dataset, dan menjalankan eksperimen dari terminal)

Hasil evaluasi & pelajaran

  • Saat menggunakan Skills, tingkat penyelesaian Claude Code 82% vs 9% tanpa Skills
  • Akurasi pemanggilan Skills: jika terlalu banyak (20), salah operasi ↑ → jika dikurangi ke sekitar 12, akurasi ↑
  • Agar efeknya maksimal, perlu panduan yang jelas di AGENTS.md atau CLAUDE.md tentang “kapan harus memakai Skills tertentu”

Prospek ke depan

  • Dengan memanfaatkan Skills LangSmith, agen bisa menjalankan loop perbaikan diri berupa menganalisis log eksekusinya sendiri → merangkum masalah → otomatis membuat evaluator+dataset pengujian.
  • Ke depan, kemungkinan siklus berbasis terminal di mana “agen meningkatkan agen” akan menjadi arus utama.

Belum ada komentar.

Belum ada komentar.