1 poin oleh GN⁺ 1 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Skill untuk agentic coding di Claude Code dan Codex yang membantu mengembangkan bukan hanya proyek, tetapi juga keahlian pengguna
  • Setelah menyelesaikan pekerjaan arsitektur seperti membuat file baru, mengubah skema, atau refactoring, Claude akan mengusulkan latihan belajar opsional selama 10–15 menit
  • Latihan menggunakan teknik ilmu pembelajaran seperti prediksi, generasi, latihan pengambilan kembali, dan pengulangan berspasi, serta membuat contoh yang setengah terselesaikan dari pekerjaan proyek nyata pengguna
  • Dirancang untuk mengurangi masalah bahwa alat coding AI dapat memicu penerimaan kode yang dihasilkan, ilusi kefasihan, kerja maraton berkepanjangan, kurangnya metakognisi, dan berkurangnya pengujian diri
  • Claude akan bertanya seperti “Apakah Anda ingin mencoba latihan belajar singkat tentang topik ini? Sekitar 10–15 menit,” dan jika pengguna menerima, latihan interaktif akan dimulai
  • Prinsip desain utamanya adalah Claude tidak menjawab pertanyaannya sendiri dan menunggu masukan pengguna, dengan tujuan menciptakan mode refleksi dan eksplorasi yang berbeda dari agentic coding yang serba cepat
  • Jenis latihan mencakup prediksi→observasi→refleksi, generasi→perbandingan, pelacakan jalur eksekusi, prediksi debugging, menjelaskan kepada developer baru, dan pemeriksaan pengambilan kembali isi sesi sebelumnya
  • Kondisi penekanan yang saat ini diusulkan adalah tidak menawarkan kembali kesempatan belajar jika dalam satu sesi pengguna sudah menolak latihan, atau sudah menyelesaikan latihan 2 kali
  • Di Codex, dapat ditambahkan ke marketplace dengan codex plugin marketplace add https://github.com/DrCatHicks/learning-opportunities.git, dan mencakup learning-opportunities, learning-opportunities-auto, serta orient
  • Di Claude Code, tambahkan melalui Claude Code plugin marketplace, lalu instal /plugin install learning-opportunities@learning-opportunities dan mulai ulang untuk mengaktifkannya
  • learning-opportunities-auto adalah hook opsional di Linux dan macOS yang membuat Claude mempertimbangkan usulan latihan setelah git commit, dan di Windows juga bisa digunakan dengan pengaturan tambahan
  • Skill orient membuat orientation.md saat mempelajari repositori baru, dan menyediakan pelajaran yang direkomendasikan berdasarkan riset pemahaman program dan eksplorasi codebase
  • Cocok digunakan bersama Learning-Goal, yang diperkenalkan sebagai skill untuk membantu penetapan tujuan belajar interaktif semi-terstruktur dengan teknik MCII
  • Untuk eksperimen tim, MEASURE-THIS.md juga dapat digunakan bersama, menyediakan butir survei tervalidasi, panduan interpretasi hasil, templat “team boast” untuk dibagikan ke pimpinan, serta dorongan ketelitian statistik Claude.md
  • Berlisensi Creative Commons Attribution 4.0 International License

1 komentar

 
GN⁺ 1 jam lalu
Komentar Hacker News
  • Saya kurang tahu soal Skills, tetapi melihat repositorinya, kode dan teks dekoratif tampak berlebihan dibanding satu prompt pendek di dalam skrip bash yang berjalan setelah commit
    Intinya kurang lebih hanya menyuruh agar karena pengguna baru saja melakukan commit, jika ada file baru, perubahan skema, keputusan arsitektur, refaktor, atau pola yang belum familier, maka sarankan latihan belajar 10–15 menit

    • Skills berguna untuk mendeskripsikan alur kerja yang dapat diulang secara standar, menghemat konteks lewat pengungkapan bertahap, membagikan prompt, dan mengemas bagian yang jarang dipakai tetapi tidak deterministik menjadi prosedur deterministik seperti skrip
      Secara konsep, ini seharusnya dilihat bukan sebagai mengambil sihir buatan orang lain, melainkan perangkat lunak yang tumbuh secara bertahap https://alexhans.github.io/posts/series/evals/building-agent...
      Dalam coding harness, sering ada skill agen SkillBuilder, jadi mudah dibuat dan terus dikembangkan
      Saya merekomendasikan membuatnya sendiri sesuai kesulitan yang Anda alami, dan ada juga contoh sederhana yang menunjukkan akurasi otomasi bisa cukup ditingkatkan lewat evaluasi https://alexhans.github.io/posts/series/evals/sketch-to-text...
    • Sebagian besar alat seperti ini pada akhirnya hanyalah file Markdown lain yang disisipkan ke dalam prompt, dan itu struktur yang wajar mengingat cara kerja model bahasa besar
      Karena itu saya ingin menyarankan agar Anda membuat alat serupa sendiri dengan Claude. Awalnya memang menghabiskan token, tetapi setelah itu alat buatan sendiri bisa sangat mengurangi token dan pemanggilan yang dibutuhkan untuk pekerjaan bermakna
      Pemanggilan tool juga bisa dikunci lebih aman, pekerjaan agen bisa dibuat dapat dicoba ulang, dan mode kegagalan bisa dikurangi. Anda juga bisa menghindari situasi saat laptop mati di tengah pekerjaan lalu agen membakar banyak token hanya untuk memulihkan sampai di mana ia sudah bekerja
  • Saya terkejut karena beberapa Skills bahkan tidak menuliskan prosedur yang tepat atau apa yang harus dilakukan, melainkan hanya melakukan priming seperti pidato motivasi agar model menghasilkan teks yang lebih baik untuk tugas tertentu
    Bahkan frontend design skill yang dipakai Claude kurang lebih hanya seperti memohon agar memilih font yang bagus dan menjaga desain tetap konsisten, tanpa kekhususan soal font apa yang dipakai atau bagaimana membuat palet warna dan tata letak
    https://github.com/anthropics/claude-code/blob/main/plugins/...

  • Pada agen penulis kode bisa muncul utang yang berulang. Jika Anda menerima hasil coding assistant tanpa memeriksa apakah itu benar, pengetahuan tentang codebase Anda sendiri akan hilang
    File konteks seperti CLAUDE.md, protokol migrasi, dan protokol autentikasi hanya bekerja baik jika Anda cukup memahaminya untuk memperbaruinya dengan benar
    Saya pernah secara buta menerima kode buatan agen selama dua jam, lalu tidak bisa membuat file konteks baru karena sudah lupa bagaimana codebase itu bekerja. Utang keterampilan seperti ini tidak terlihat di diff, tetapi muncul saat Anda harus memandu agen

    • Mungkin bukan berulang, melainkan rekursif
      Saat melakukan perubahan fitur besar, ada baiknya sebelum menyuruh agen menulis kode, Anda lebih dulu menyepakati masalah domain bisnis yang ingin diselesaikan di chat. Rasanya seperti duduk bersama perwakilan vendor pengembang eksternal dan merapikan apa yang diinginkan
      Setelah itu, bersama agen, tulis dokumen desain berbentuk bullet hierarkis sebagai file .md sungguhan, biarkan agen yang sebagian besar membuat dan mengubahnya, tetapi telaah masalah dan keputusan ambigu dengan cermat agar keputusan tingkat desain diselesaikan lebih dulu di sini
      Lalu minta agar spesifikasi desain itu diubah menjadi kerangka kumpulan tes spesifikasi BDD, dan biarkan diisi saat implementasi
      Pada tahap implementasi, unit test dan integration test boleh ditambah, diubah, atau dihapus, tetapi file spesifikasi desain dan struktur tes BDD turunan darinya harus tetap. Sebelum selesai, tes BDD harus terisi dengan logika yang sesuai label dan semuanya harus lulus
      Jika proyeknya sangat besar, Anda bisa menjalankan sprint yang mengulangi proses seperti mendefinisikan kebutuhan bisnis baru, merevisi desain, dan menambah bundel BDD. Atau di antara tahap 2 dan 3, desain bisa dibagi menjadi milestone, lalu item BDD dibuat dan diselesaikan hanya untuk milestone saat ini
      Pada akhirnya ini berarti memakai pendekatan waterfall untuk LLM. Jika seluruh proses selesai dalam satu jam, waterfall pun bisa terasa cukup nyaman
      Kuncinya adalah setelah proyek atau milestone selesai, minta agen menjelaskan kode yang ditulisnya di chat, tetapi batasi agar tidak menjelaskan hal-hal yang sudah tampak di desain
      Dengan begitu, penjelasan tentang bagian yang mengejutkan bisa diubah menjadi komentar kode, dan hasilnya bukan komentar sampah yang formalistis, melainkan komentar yang terasa seperti ditulis manusia
  • Tanpa benchmark dan evaluasi, bagaimana kita tahu bahwa hasilnya lebih baik daripada /create-skill? Tes naif tidak menumbuhkan kepercayaan

    • Sepertinya yang dimaksud di sini adalah pengembangan keterampilan manusia. Ini fitur untuk memberi pengguna kesempatan belajar
      Ada penjelasan bahwa ketika pekerjaan arsitektur selesai, Claude akan menyarankan latihan pilihan 10–15 menit yang didasarkan pada ilmu belajar berbasis bukti. Caranya dengan memakai teknik seperti prediksi, generasi, latihan retrieval, dan spaced repetition, sambil memberi contoh setengah jadi dari pekerjaan proyek pengguna sendiri
      Namanya memang membingungkan
    • Rasanya seperti sudah terlalu terendam dalam LLM sampai istilah terkait apa pun langsung memicu reaksi Pavlovian
    • Bagus juga evaluasi diangkat, tetapi sekarang saya penasaran apa yang dipakai atau dicari. Apakah membuatnya sendiri, atau juga memakai framework evaluasi yang sudah ada
  • Bagi orang yang belum masuk ke lubang kelinci ini, Skills adalah file Markdown terstruktur yang menjelaskan bagaimana menangani tugas dengan cakupan sempit
    Misalnya, jika Anda menulis API endpoint dengan cara tertentu, prosedurnya ditulis di skill. Nanti agen melihat skill ini dan jika menilai bahwa itu relevan dengan konteks chat saat ini, ia akan memuatnya lalu menjalankannya sesuai petunjuk
    Ini mirip pemanggilan tool, tetapi bukan fungsi yang bisa dipanggil, melainkan panduan tentang cara melakukan “skill” tersebut
    Setidaknya di Cline yang saya pakai, Skills bisa didefinisikan secara global atau lokal di tingkat proyek

    • Skills juga punya header bernama frontmatter, dan sebagian darinya dibagikan di awal konteks seperti file CLAUDE.md
      Dari yang saya dengar di sini, pemuatan skill bisa memberi dampak konteks tersendiri, misalnya tetap bertahan setelah kompresi
      Jika banyak skill dimuat, bisa saja semuanya tetap termuat secara permanen dalam sesi
      Saya rasa ini cocok dengan subagent. Jika subagent memuat skill, menyelesaikan tugas, lalu hanya menyajikan hasilnya, agen orkestrator tidak perlu mengetahui isinya
  • Saya tidak yakin apa sebenarnya adaptive dynamic textbook approach itu. Saya butuh contoh
    Pernyataan bahwa jika kita menerima kode yang dihasilkan dan jadi menulis lebih sedikit kode sendiri, kita melewatkan pemrosesan aktif untuk membangun pemahaman memang sangat benar

  • Saya tidak paham mengapa orang repot-repot membuat ide sekeren ini tetapi tidak menyertakan tautan demo atau contoh output. Ini pola yang saya lihat setiap hari di HN
    Apakah satu-satunya cara untuk melihat seperti apa skill ini sebenarnya adalah dengan mengunduh dan menjalankannya sendiri? Saya tidak ingin melakukannya

    • Sejauh ini penggunaan skill terasa jauh kurang stabil dibanding instruksi yang jelas di AGENTS.md
      Saya paham idenya adalah menghindari pembengkakan konteks dengan tidak menambahkan skill saat tidak relevan, tetapi tanpa instruksi eksplisit di AGENTS.md, tidak ada jaminan agen akan memakai skill itu. Kalau begitu, bedanya dengan file Markdown yang dirujuk di lokasi tertentu jadi makin kecil
      Saat membuat https://www.agentkanban.io, saya banyak bereksperimen soal di mana menaruh instruksi untuk papan kerja terintegrasi GitHub Copilot
      Struktur satu tingkat di bawah AGENTS.md bekerja cukup baik. Karena saya perlu agar agen secara stabil mengambil ID per tugas, akhirnya saya menetap pada pendekatan menaruh INSTRUCTION.md di file yang dikelola tool, dan ini juga mengurangi polusi di AGENTS.md
      Saya juga bereksperimen dengan Skills, tetapi terlalu sering terlewati, sehingga sulit membuat tool bekerja sestabil pendekatan saya sekarang
    • Karena ada SKILL.md, cukup baca saja dan Anda akan tahu apa yang dilakukannya
  • Saya sangat suka idenya. Saya pernah meminta Claude memakai materi ajar dan dokumentasi open source untuk membuat buku ajar secara spontan
    Saya penasaran apakah skill ini bisa diperluas ke ranah pembelajaran dan penerapan yang lebih umum, atau memang khusus untuk kode

  • Reaksi di sini menarik, tetapi kebanyakan tampaknya melewatkan inti
    Bagi saya, pelajaran pentingnya adalah belajar dengan melihat bagaimana orang lain menggunakan Skills. Kemarin saya menonton kelas Matt Pocock tentang pemanfaatan agen, dan dia menunjukkan Skills seperti memakai skill “grill-me” untuk mengembangkan dokumen kebutuhan produk
    Saya mungkin tidak akan meniru persis apa yang dia lakukan, tetapi saya jadi mendapatkan ide tentang cara saya membuat kebutuhan dan mengimplementasikannya
    Dengan kata-kata para engineer Anthropic, Claude itu seperti engineer berbakat tetapi kurang spesialisasi. Skills adalah folder dan file untuk membangun spesialisasi itu
    Hal lain yang saya pelajari dari Pocock adalah bahwa makin panjang konteks atau ukuran token, respons cenderung makin bodoh. Jadi Skills adalah cara lain untuk menyajikan masalah kepada LLM dalam bentuk yang terkompresi dan mendapatkan respons yang dioptimalkan
    Claude juga punya karakter perilaku. Jika seseorang berulang kali membuat skill, kemungkinan besar itu tidak akan mudah dipindahkan ke pengguna lain. Soalnya tiap orang punya cara berbeda dalam berbicara dengan Claude
    Karena itu saya ragu membagikan folder skill saya ke rekan kerja. Sebagai gantinya saya akan menunjukkan apa yang saya buat sebagai demo agar mereka melihat apa yang mungkin dilakukan dan masing-masing menemukan alur kerja sendiri
    Nilainya ada pada melihat bagaimana orang lain membuat sesuatu dengan Claude lalu menirunya dengan cara sendiri. Mirip saat pertama belajar pemrograman, menyalin kode dari buku C karya Kernighan dan Ritchie, lalu mengubahnya untuk memahami cara kerjanya, dan setelah itu memodifikasinya sesuai tujuan sendiri
    Alasan lain saya menyinggung karakter perilaku adalah karena penulisnya seorang psikolog, jadi menarik bahwa cara dia berinteraksi dengan Claude mungkin cukup berbeda dari programmer
    Terkait itu, karena penulis dan banyak pakar lintas bidang sudah lama meninggalkan Twitter, saya jadi ingin memasang bsky atau Mastodon dan mengikuti mereka. Menurut saya penting mengamati bagaimana non-programmer yang ahli di bidangnya memakai LLM

  • Idénya bagus, jadi pagi ini saya mencoba menjelajahinya sedikit
    Karena terlalu banyak memakai AI, saya sangat merasakan semacam brain drain, dan meski ini bukan solusi sempurna, saya rasa melakukan beberapa latihan per hari saja bisa sangat membantu