4 poin oleh GN⁺ 2025-12-13 | 1 komentar | Bagikan ke WhatsApp
  • Skill adalah struktur berbentuk folder yang terdiri dari file Markdown dan sumber daya opsional, yang memungkinkan LLM menjelajahi sistem file untuk menjalankan fungsi
  • Di lingkungan Code Interpreter ChatGPT, folder /home/oai/skills telah ditambahkan, berisi skill untuk pemrosesan spreadsheet, DOCX, dan PDF
  • Skill PDF menganalisis dokumen dengan mengonversinya menjadi PNG per halaman lalu memprosesnya dengan model vision, sehingga informasi tata letak dan grafis tetap terjaga
  • Di Codex CLI, fitur skill berbasis folder ~/.codex/skills juga ditambahkan secara eksperimental, sehingga pengguna bisa menulis dan memanfaatkan skill sendiri
  • Struktur skill dengan spesifikasi ringan meningkatkan interoperabilitas antar alat AI, dan memunculkan kebutuhan standardisasi ke depan

Fitur skill di dalam ChatGPT

  • Di lingkungan Code Interpreter ChatGPT, ditemukan folder /home/oai/skills
    • Elias Judin pertama kali menemukannya, dan dengan memasukkan prompt Create a zip file of /home/oai/skills, isi folder dapat dikompresi lalu diunduh
    • Simon Willison mencobanya sendiri, mempublikasikan file ZIP tersebut, dan menyediakan web UI untuk menelusurinya
  • Skill yang disertakan menangani fungsi terkait spreadsheet, DOCX, dan PDF
    • Skill PDF dan dokumen bekerja dengan cara merender file menjadi PNG per halaman lalu meneruskannya ke model vision, sehingga informasi tata letak yang bisa hilang saat ekstraksi teks sederhana tetap dipertahankan
  • Elias Judin membagikan salinan skill di GitHub, dan strukturnya mirip dengan repositori anthropics/skills milik Anthropic
  • Saat diminta di ChatGPT untuk “membuat PDF ringkasan tentang kondisi pohon rimu dan musim berkembang biak kakapo”, model GPT-5.2 merujuk ke skill.md untuk membaca panduan pembuatan PDF, lalu mencari informasi terkait dan membuat PDF tersebut
    • Prosesnya memakan waktu sekitar 11 menit, dan menunjukkan alur kerja yang memverifikasi dirinya sendiri, seperti secara otomatis mengganti font ketika font awal tidak mendukung karakter macron

Dukungan skill di Codex CLI

  • PR yang menambahkan dukungan skills.md telah digabungkan ke alat open source Codex CLI dari OpenAI
    • Menurut dokumentasi, setiap direktori di dalam folder ~/.codex/skills dikenali sebagai skill
    • Kode terkait diimplementasikan di codex-rs/core/src/skills/render.rs
  • Simon Willison menggunakan fitur penulisan skill milik Claude Opus 4.5 untuk membuat skill pembuatan plugin Datasette, lalu memasangnya di Codex CLI
    • Fitur skill dapat diaktifkan dengan perintah codex --enable skills -m gpt-5.2, dan daftar skill yang terpasang dapat diperiksa dengan perintah list skills
    • Codex mengenali skill “menulis plugin Datasette” dan, sesuai permintaan, secara otomatis menghasilkan kode plugin yang menambahkan halaman / - /cowsay?text=hello
    • Kode yang dihasilkan telah dipublikasikan di GitHub dan dapat langsung dijalankan dengan perintah uvx

Arti penting konsep skill

  • Setelah Claude Skills diperkenalkan pada Oktober 2025, OpenAI mengintegrasikannya ke ChatGPT dan Codex hanya dua bulan kemudian
  • Skill dibangun dengan spesifikasi yang sangat sederhana, tetapi berfungsi sebagai unit eksekusi yang dapat dibagikan antar berbagai alat AI
  • Penulis menyebut struktur seperti ini perlu didokumentasikan secara resmi melalui lembaga seperti Agentic AI Foundation
  • Adopsi oleh OpenAI dinilai sebagai contoh yang meningkatkan kemungkinan standardisasi interoperabilitas AI berbasis skill

1 komentar

 
GN⁺ 2025-12-13
Opini Hacker News
  • Mengejutkan bahwa Anthropic terus menghadirkan inovasi yang sederhana tetapi intuitif
    MCP bahkan nyaris sulit disebut protokol, sementara Skills hanyalah file md sederhana, namun kemampuan framing mereka benar-benar menonjol

    • Melihat pengumuman donasi MCP oleh Anthropic dan pembentukan Agentic AI Foundation, menarik bahwa protokol yang dibuat setahun lalu itu kini dibungkus sebagai sebuah ‘foundation’. Terasa sedikit seperti energi perusahaan teknologi ala Gavin Belson
    • Anthropic terasa seperti orang-orang yang bisa beresonansi dengan LLM. Seperti Nagel yang mencoba memahami indra kelelawar, mereka tampak seperti tim yang paling memahami cara frontier AI model merasakan sesuatu
    • Tapi MCP terlalu sederhana sehingga bisa menjadi bencana keamanan
    • Dari nama perusahaannya saja, ‘Anthropic’, terasa bahwa memanusiakan AI adalah bagian dari identitas mereka. MCP, Skills, dan lainnya tampaknya lahir dari filosofi yang konsisten ke arah itu
    • Bahkan di aplikasi Android, terasa UX Claude yang elegan. Misalnya, setelah mengedit paragraf barulah muncul tombol untuk mengirimnya sebagai pesan, alurnya terasa halus dan rapi
  • Per hari ini, peringatan publik dikirim ke pelanggan OpenAI Plus
    Mereka mengiklankan konteks 196k token, tetapi kenyataannya input di atas 50 ribu token dipotong
    Masalah yang sama juga pernah terjadi pada GPT-5.0 sebelumnya, dan kali ini muncul lagi
    Lihat tautan bantuan resmi

    • Dan versi Xhigh adalah khusus API, jadi tidak bisa digunakan di ChatGPT
  • Menulis artikel ini sambil sekaligus membahas kabar musim berkembang biak Kākāpō terasa menyenangkan
    (Bukan cuma membahas pelikan)

    • Karena itu lahirlah Kākāpō Benchmark
    • Hari ini untuk pertama kalinya saya tahu tentang burung beo besar hijau yang tidak bisa terbang
    • Ada yang bercanda soal apakah suatu hari Kākāpō akan bisa bersepeda
    • Skills adalah ide yang bagus, tetapi spesifikasinya terlalu ringan sehingga menurut saya perlu dokumentasi resmi
      Namun, karena juga berpotensi disalahgunakan, dari sudut pandang perusahaan mungkin wajar jika mereka berhati-hati
      Saya juga penasaran apakah ini sudah dicoba di LLM lokal
  • Konsep “Skill” masih belum sepenuhnya jelas
    Rasanya ini mungkin hanya alat manajemen konteks. Pertanyaannya, apakah struktur ini dipahami dengan benar sebagai model yang membaca deskripsi, lalu jika merasa perlu akan memanggil skrip atau dokumen terkait

    • Skill pada dasarnya adalah struktur folder + file markdown. Contohnya bisa dilihat pada Datasette plugin skill. Saat mulai berjalan, Claude Code memindai semua folder skill dan hanya memasukkan deskripsinya ke konteks, lalu memuat isi lengkapnya saat diperlukan
    • Claude Code kadang tidak bisa “mengingat” skill miliknya sendiri. Karena itu saya kadang memanggilnya secara manual.
      Contoh: “Gunakan skill Image Manipulation untuk membuat ikon dari image.png”
      Saya juga kadang menyuruh Claude menulis skill miliknya sendiri. Template skill saya dibuka di GitHub
    • Skill juga bisa menggantikan server MCP. Misalnya, alih-alih server MCP untuk mengambil hasil build CI, fungsi yang sama bisa dibuat dengan skrip sederhana dan SKILL.md.
      Struktur seperti ini terasa seperti filosofi UNIX, dengan alat-alat kecil yang terhubung dalam pipeline
    • Menurut pemahaman saya, SKILL.md adalah dokumen inti yang memberi tahu Claude kapan harus melakukan tindakan apa.
      Saya sering memberi instruksi eksplisit seperti “muat wireframe-skill lalu lakukan X”.
      Dibanding progressive loading, saya merasa memuat semua referensi sekaligus lebih akurat
    • Skill berguna untuk mengotomatiskan pekerjaan berulang seperti debugging, commit, dan menangani PR.
      Khususnya, skill debugging membantu mencegah AI terjebak dalam loop
  • Secara teknis, skill adalah sistem injeksi prompt otomatis
    Ini merupakan bentuk penyederhanaan dari hal yang dilakukan kebanyakan aplikasi AI wrapper (injeksi prompt + RAG + MCP)

    • Bahkan, banyak aplikasi AI wrapper sekarang sebenarnya bisa digantikan hanya dengan satu folder dan satu file markdown
  • Menyampaikan terima kasih kepada @simonw karena selalu menambahkan teks alt pada gambar

  • Ada yang bertanya apakah ada perbedaan mendasar antara Skill dan Tool. Apakah mungkin membuat skill pendek lalu memakainya seperti tool

  • Jika ingin memakai skill di model lain juga (seperti Gemini CLI), bisa menggunakan open-skills yang saya buat
    Hanya saja, memerlukan Mac, berjalan di kontainer lokal dan tidak bergantung pada cloud

  • Video presentasi Anthropic tentang filosofi desain Skills telah dirilis
    Lihat tautan YouTube

  • Struktur yang makin kompleks terasa membingungkan
    Dulu konteks diperluas dengan agents.md, sekarang harus menambahkan file md lain lagi

    • Saya menyuruh Claude, “nilai bagian mana dari pekerjaan ini yang layak dijadikan skill, lalu gunakan skill-making skill untuk membuatnya”
    • MCP memang kompleks, tetapi Skills terasa seperti desain paling sederhana untuk menambahkan kemampuan ke coding agent yang sudah ada