16 poin oleh GN⁺ 2025-12-22 | 1 komentar | Bagikan ke WhatsApp
  • Agent Skills adalah struktur ekstensi yang menambahkan kemampuan khusus per tugas ke Codex agar dapat menjalankan workflow tertentu secara andal
  • Setiap skill terdiri dari file SKILL.md serta skrip, resource, dan aset opsional, sehingga dapat dibagikan antar tim atau komunitas
  • Codex menjalankan skill melalui pemanggilan eksplisit (perintah /skills atau input $) dan pemanggilan implisit (digunakan otomatis saat cocok dengan deskripsi tugas)
  • Skill dikelola melalui beberapa lokasi penyimpanan dan sistem prioritas seperti REPO, USER, ADMIN, SYSTEM, dan skill baru dapat dibuat dengan $skill-creator
  • Fitur ini dapat digunakan baik di CLI maupun ekstensi IDE Codex, dan fungsinya bisa diperluas dengan memasang skill dari GitHub dan lainnya

Ikhtisar Agent Skills

  • Agent Skills adalah struktur yang memberi Codex fungsi dan keahlian baru
    • Skill mengemas instruksi, resource, dan skrip opsional untuk menjalankan tugas tertentu
    • Dapat dibagikan antar tim atau komunitas, dan didasarkan pada open Agent Skills standard
  • Dapat digunakan baik di CLI maupun ekstensi IDE Codex

Struktur dan Komponen Skill

  • Setiap skill disusun dengan file SKILL.md sebagai inti, dengan struktur folder seperti berikut
    • SKILL.md: wajib, berisi instruksi dan metadata
    • scripts/: kode eksekusi opsional
    • references/: dokumentasi opsional
    • assets/: template dan resource opsional
  • Codex menggunakan pendekatan progressive disclosure untuk mengelola konteks secara efisien
    • Saat mulai, hanya nama dan deskripsi skill yang dimuat, lalu instruksi lengkap dibaca saat diperlukan

Cara Pemanggilan Skill

  • Pemanggilan eksplisit (Explicit invocation)
    • Menentukan skill secara langsung dengan perintah /skills atau input $
    • Versi web dan iOS Codex belum mendukung pemanggilan eksplisit, tetapi skill yang disertakan di repositori tetap dapat digunakan melalui prompt
  • Pemanggilan implisit (Implicit invocation)
    • Codex otomatis menggunakan skill terkait saat tugas pengguna cocok dengan deskripsi skill

Lokasi Penyimpanan dan Prioritas Skill

  • Codex memuat skill dari beberapa lokasi, dan skill dari lokasi dengan prioritas lebih tinggi akan menimpa skill bernama sama dari prioritas lebih rendah
  • Cakupan dan lokasi utama
    • REPO: $CWD/.codex/skills, $CWD/../.codex/skills, $REPO_ROOT/.codex/skills
    • USER: $CODEX_HOME/skills atau ~/.codex/skills
    • ADMIN: /etc/codex/skills
    • SYSTEM: skill bawaan yang disertakan dalam Codex
  • Setiap cakupan digunakan sesuai tujuan pengelolaan di tingkat pribadi, tim, dan sistem

Cara Membuat Skill

  • Skill bawaan Codex $skill-creator dapat digunakan untuk membuat skill baru secara otomatis
    • Jika digabungkan dengan skill $plan, perencanaan dapat dibuat sebelum pembuatan skill
  • Untuk membuat secara manual, buat folder di lokasi yang valid lalu tulis file SKILL.md
    • Item wajib: name, description
    • Item opsional: metadata.short-description
  • Skill didasarkan pada Agent Skills specification

Pemasangan Skill dan Contoh

  • Skill dapat dipasang dari repositori skill publik di GitHub dengan menggunakan skill $skill-installer
    • Contoh: $skill-installer linear
    • Skill dari repositori lain juga dapat dipasang
  • Contoh skill bawaan
    • $plan: menyusun rencana untuk pengembangan fitur baru atau pemecahan masalah kompleks
    • $skill-installer linear: akses ke konteks Linear
    • $skill-installer notion-spec-to-implementation: akses ke data Notion

Arti Penting bagi Pengembang Codex

  • Agent Skills adalah komponen inti yang meningkatkan ekstensibilitas dan kolaborasi Codex
  • Pengembang dapat mendefinisikan skill mereka sendiri untuk membangun workflow pengembangan otomatis
  • Integrasi CLI·IDE, integrasi GitHub, dan spesifikasi skill yang terstandarisasi memperkuat potensi perluasan ekosistem Codex

1 komentar

 
GN⁺ 2025-12-22
Komentar Hacker News
  • Sangat menyenangkan melihat Skills benar-benar menjadi standar
    Bisa ditulis hanya dengan file Markdown sederhana, dan pada dasarnya efisien dalam context
    Karena bisa ditumpangkan di atas alat yang sudah ada, kita bahkan bisa membuat skill yang menjelaskan cara memakai gh CLI alih-alih GitHub MCP
    Beberapa skill bisa digabungkan, dan skrip Python atau JS juga bisa disertakan
    Hasilnya, pendekatan ini jadi jauh lebih sederhana dan fleksibel tanpa perlu mengekspos server MCP terpisah

    • Selain itu, agen itu sendiri bisa mengedit, menyempurnakan, dan menambahkan skill
      Misalnya bisa diotomatisasi dengan perintah seperti “tolong tambahkan poin inti dari sesi ini sebagai skill”
      Bukan hanya dari sesi yang bagus, pembelajaran dari sesi yang penuh trial and error juga bisa disimpan sebagai skill
      Ini memberi alur perluasan kemampuan yang jauh lebih cepat dan mudah diakses dibanding MCP
    • Saya sedang memikirkan bagaimana skill bisa dimanfaatkan dalam web app Django + PostgreSQL + Python berukuran menengah
      Saya juga penasaran apakah ini justru lebih berguna di sisi data science atau DevOps daripada untuk CRUD-sentris
    • Pada akhirnya, skill terasa seperti konsep caching resep use case / workflow
  • Inti dari Skills adalah, secara spesifikasi, isi utama kode skill atau markdown tidak dikenai RAG
    Artinya, hanya nama dan deskripsi di front-matter yang dimasukkan ke prompt untuk pemilihan skill
    Karena itu, logika yang tidak disebut di deskripsi bisa saja sama sekali tidak ditemukan
    Selain itu, deskripsi skill adalah semacam prompt injection, sehingga ikut memengaruhi tone keseluruhan maupun biaya token
    Untuk contoh terkait, lihat tautan kode ini

    • Secara pribadi saya merasa indeks skill bisa menjadi beban ketimbang bantuan
      Menjaga context tetap bersih itu penting, jadi saya lebih suka menambahkan file md secara langsung hanya saat diperlukan
      MCP terlalu kompleks, dan bahkan skill pun terasa sedikit overengineered
    • Beberapa sistem agentic memang menerapkan RAG pada skill
      Ini lebih merupakan masalah desain agentic harness daripada masalah LLM itu sendiri
      Ke depan, tampaknya LLM dan harness akan terintegrasi lebih erat
    • MCP maupun tools pada akhirnya punya masalah yang sama
  • Saya sudah lama memakai pendekatan serupa
    Saya membuat folder untuk tiap fungsi, lalu menata README.md, scripts, dan GUIDE.md
    Saat menemukan kode yang bisa dipakai ulang, misalnya integrasi clerk.dev, saya rapikan ke dalam folder,
    lalu menggabungkannya saat perlu dengan merge-to-md
    Pendekatan ini bekerja sangat baik, jadi menyenangkan melihat kemampuan seperti ini kini tersedia bawaan di agen

    • Penjelasan ini membuat konsep skill jadi mudah dipahami
  • Dalam jangka panjang, Skills tampaknya bisa berkembang seperti library open source
    Jika solusi yang sudah distandardisasi seperti autentikasi atau multitenancy disediakan sebagai skill,
    keamanan dan kualitas kode akan meningkat drastis

    • Lebih jauh lagi, kalau model bisa mencari dan mengunduh skill yang dibutuhkan dari indeks skill global,
      lalu langsung memakainya, ini bahkan bisa menjadi alternatif bagi pembelajaran berkelanjutan
  • Skills, plugins, apps, connectors, MCPs, agents… jujur saja membingungkan

    • Kebingungan ini terjadi karena teknologinya masih belum matang dan berubah sangat cepat
      Pendekatan terbaiknya belum ditetapkan, dan istilah-istilahnya juga belum rapi
      Bahkan makna “Agent” sendiri berbeda-beda tergantung kelompoknya
    • Sebenarnya semua ini hanyalah alat bantu untuk memanggil context
      Selain eksekusi tool, semuanya adalah berbagai cara untuk menambahkan konteks ke prompt
    • Ada yang menyebut semuanya ini hanya tambalan sementara (bandaid)
    • Ada juga yang melihatnya sekadar sebagai nama pemasaran untuk API dan prompt
    • Ini juga mirip dengan fenomena LLM yang menghasilkan banyak ide yang serupa tetapi sedikit berbeda
  • Baru-baru ini, dalam tulisan ini,
    dijelaskan struktur ketika agent berulang kali memanggil LLM sambil bertukar permintaan penggunaan tool dalam format JSON,
    dan saya jadi penasaran seperti apa bentuk skill dalam framework semacam itu

    • Sebelum loop pertama, harness mengirim blok <Skills> ke LLM
      Contoh: <Skill><Name>postgres</Name><Description>cara query DB pre-prod</Description><File>skills/postgres.md</File></Skill>
      Pemberitahuan ini dikirim ulang secara berkala agar LLM tidak “melupakan” skill tersebut
      Pada akhirnya yang dikirim hanya nama + deskripsi + path file, jadi biaya tokennya kecil
      Tetapi jika LLM cukup pintar, mungkin ia tetap bisa bekerja baik tanpa struktur seperti ini
    • Agen akan memuat secara selektif satu atau lebih skill saat dibutuhkan
      Ini adalah cara standar untuk memanggil prompt skill beserta skrip terkaitnya
  • Banyak orang salah paham tentang Skills
    Intinya bukan file .md, melainkan bundling kode dan instruksi
    Skills mengasumsikan adanya lingkungan eksekusi kode

    • Kode yang bisa dieksekusi dapat disetujui lebih dulu lalu dipanggil dari prompt saat diperlukan
      Keunggulan besarnya adalah penghematan context lewat pengindeksan metadata dan lazy loading
    • Ada yang menyebut ini sebagai kebangkitan literate programming
  • Jika ada marketplace skills.md, rasanya itu bisa membantu penyebaran teknologi

    • Namun secara realistis, saya rasa akan sulit dijalankan karena masalah spam, keamanan, dan tidak adanya profitabilitas
      Cukup lihat saja kasus spam terkait MCP
      Pada akhirnya besar kemungkinan hanya akan bertahan di sekitar perusahaan tepercaya atau developer ternama
    • Sudah ada repositori skills milik Anthropic
      Memang belum ada rating atau komentar, tetapi kualitasnya cukup menjanjikan
    • Upaya seperti ini sering muncul, tetapi karena biaya membuat skill kustom nyaris 0,
      insentif untuk memakai prompt milik orang lain jadi kecil
    • Saya juga membuat skill untuk menulis skill dengan merujuk ke dokumentasi Anthropic
      Pada akhirnya yang penting adalah mengoptimalkannya agar sesuai dengan workflow dan codebase sendiri
  • Saya penasaran apakah skill yang dihasilkan bisa dipakai agar agen merangkum solusi akhir yang diperoleh setelah berkali-kali mencoba

    • Saya juga membuat “meta skill” agar setelah sesi selesai, ia memperbarui aturannya sendiri
      Dengan begitu saya sedang membangun semacam efek flywheel
  • Ada candaan bahwa Anthropic terlihat seperti Chief Product Officer-nya OpenAI

    • Lalu muncul candaan lanjutan: “tanpa bayaran juga”