OpenAI diam-diam memperkenalkan ‘Skills’, tersedia di ChatGPT dan Codex CLI
(simonwillison.net)- Skill adalah struktur berbentuk folder yang terdiri dari file Markdown dan sumber daya opsional, yang memungkinkan LLM menjelajahi sistem file untuk menjalankan fungsi
- Di lingkungan Code Interpreter ChatGPT, folder
/home/oai/skillstelah ditambahkan, berisi skill untuk pemrosesan spreadsheet, DOCX, dan PDF - Skill PDF menganalisis dokumen dengan mengonversinya menjadi PNG per halaman lalu memprosesnya dengan model vision, sehingga informasi tata letak dan grafis tetap terjaga
- Di Codex CLI, fitur skill berbasis folder
~/.codex/skillsjuga ditambahkan secara eksperimental, sehingga pengguna bisa menulis dan memanfaatkan skill sendiri - Struktur skill dengan spesifikasi ringan meningkatkan interoperabilitas antar alat AI, dan memunculkan kebutuhan standardisasi ke depan
Fitur skill di dalam ChatGPT
- Di lingkungan Code Interpreter ChatGPT, ditemukan folder
/home/oai/skills- Elias Judin pertama kali menemukannya, dan dengan memasukkan prompt
Create a zip file of /home/oai/skills, isi folder dapat dikompresi lalu diunduh - Simon Willison mencobanya sendiri, mempublikasikan file ZIP tersebut, dan menyediakan web UI untuk menelusurinya
- Elias Judin pertama kali menemukannya, dan dengan memasukkan prompt
- Skill yang disertakan menangani fungsi terkait spreadsheet, DOCX, dan PDF
- Skill PDF dan dokumen bekerja dengan cara merender file menjadi PNG per halaman lalu meneruskannya ke model vision, sehingga informasi tata letak yang bisa hilang saat ekstraksi teks sederhana tetap dipertahankan
- Elias Judin membagikan salinan skill di GitHub, dan strukturnya mirip dengan repositori
anthropics/skillsmilik Anthropic - Saat diminta di ChatGPT untuk “membuat PDF ringkasan tentang kondisi pohon rimu dan musim berkembang biak kakapo”, model GPT-5.2 merujuk ke
skill.mduntuk membaca panduan pembuatan PDF, lalu mencari informasi terkait dan membuat PDF tersebut- Prosesnya memakan waktu sekitar 11 menit, dan menunjukkan alur kerja yang memverifikasi dirinya sendiri, seperti secara otomatis mengganti font ketika font awal tidak mendukung karakter macron
Dukungan skill di Codex CLI
- PR yang menambahkan dukungan
skills.mdtelah digabungkan ke alat open source Codex CLI dari OpenAI- Menurut dokumentasi, setiap direktori di dalam folder
~/.codex/skillsdikenali sebagai skill - Kode terkait diimplementasikan di
codex-rs/core/src/skills/render.rs
- Menurut dokumentasi, setiap direktori di dalam folder
- Simon Willison menggunakan fitur penulisan skill milik Claude Opus 4.5 untuk membuat skill pembuatan plugin Datasette, lalu memasangnya di Codex CLI
- Fitur skill dapat diaktifkan dengan perintah
codex --enable skills -m gpt-5.2, dan daftar skill yang terpasang dapat diperiksa dengan perintahlist skills - Codex mengenali skill “menulis plugin Datasette” dan, sesuai permintaan, secara otomatis menghasilkan kode plugin yang menambahkan halaman / - /cowsay?text=hello
- Kode yang dihasilkan telah dipublikasikan di GitHub dan dapat langsung dijalankan dengan perintah
uvx
- Fitur skill dapat diaktifkan dengan perintah
Arti penting konsep skill
- Setelah Claude Skills diperkenalkan pada Oktober 2025, OpenAI mengintegrasikannya ke ChatGPT dan Codex hanya dua bulan kemudian
- Skill dibangun dengan spesifikasi yang sangat sederhana, tetapi berfungsi sebagai unit eksekusi yang dapat dibagikan antar berbagai alat AI
- Penulis menyebut struktur seperti ini perlu didokumentasikan secara resmi melalui lembaga seperti Agentic AI Foundation
- Adopsi oleh OpenAI dinilai sebagai contoh yang meningkatkan kemungkinan standardisasi interoperabilitas AI berbasis skill
1 komentar
Opini Hacker News
Mengejutkan bahwa Anthropic terus menghadirkan inovasi yang sederhana tetapi intuitif
MCP bahkan nyaris sulit disebut protokol, sementara Skills hanyalah file md sederhana, namun kemampuan framing mereka benar-benar menonjol
Per hari ini, peringatan publik dikirim ke pelanggan OpenAI Plus
Mereka mengiklankan konteks 196k token, tetapi kenyataannya input di atas 50 ribu token dipotong
Masalah yang sama juga pernah terjadi pada GPT-5.0 sebelumnya, dan kali ini muncul lagi
Lihat tautan bantuan resmi
Menulis artikel ini sambil sekaligus membahas kabar musim berkembang biak Kākāpō terasa menyenangkan
(Bukan cuma membahas pelikan)
Namun, karena juga berpotensi disalahgunakan, dari sudut pandang perusahaan mungkin wajar jika mereka berhati-hati
Saya juga penasaran apakah ini sudah dicoba di LLM lokal
Konsep “Skill” masih belum sepenuhnya jelas
Rasanya ini mungkin hanya alat manajemen konteks. Pertanyaannya, apakah struktur ini dipahami dengan benar sebagai model yang membaca deskripsi, lalu jika merasa perlu akan memanggil skrip atau dokumen terkait
Contoh: “Gunakan skill Image Manipulation untuk membuat ikon dari image.png”
Saya juga kadang menyuruh Claude menulis skill miliknya sendiri. Template skill saya dibuka di GitHub
Struktur seperti ini terasa seperti filosofi UNIX, dengan alat-alat kecil yang terhubung dalam pipeline
Saya sering memberi instruksi eksplisit seperti “muat wireframe-skill lalu lakukan X”.
Dibanding progressive loading, saya merasa memuat semua referensi sekaligus lebih akurat
Khususnya, skill debugging membantu mencegah AI terjebak dalam loop
Secara teknis, skill adalah sistem injeksi prompt otomatis
Ini merupakan bentuk penyederhanaan dari hal yang dilakukan kebanyakan aplikasi AI wrapper (injeksi prompt + RAG + MCP)
Menyampaikan terima kasih kepada @simonw karena selalu menambahkan teks alt pada gambar
Ada yang bertanya apakah ada perbedaan mendasar antara Skill dan Tool. Apakah mungkin membuat skill pendek lalu memakainya seperti tool
Jika ingin memakai skill di model lain juga (seperti Gemini CLI), bisa menggunakan open-skills yang saya buat
Hanya saja, memerlukan Mac, berjalan di kontainer lokal dan tidak bergantung pada cloud
Video presentasi Anthropic tentang filosofi desain Skills telah dirilis
Lihat tautan YouTube
Struktur yang makin kompleks terasa membingungkan
Dulu konteks diperluas dengan agents.md, sekarang harus menambahkan file md lain lagi