- Video webinar kuliah Codex untuk developer yang dirilis langsung oleh OpenAI (58 menit)
- Codex adalah platform agen coding yang dirancang bukan sekadar untuk penyelesaian kode atau pair programming, tetapi agar engineer dapat mendelegasikan pekerjaan berskala besar kepada agen
- Codex app, CLI, ekstensi IDE, dan berbagai antarmuka lain berbagi backend yang sama, serta dapat menjalankan banyak tugas secara paralel
- Mencakup seluruh siklus hidup pengembangan perangkat lunak (SDLC), mulai dari Plan, Design, Build, Test, Review, Document, hingga Deploy & Maintenance
- Melalui file agents.md, instruksi perilaku agen dapat diatur per repositori, dan workflow berulang bisa dipaketkan dengan Skills dan Automations untuk dijalankan secara otomatis
- Mendukung pekerjaan tanpa henti selama 25 jam dan mempertahankan konteks jangka panjang melalui 13–14 kali server-side compaction, dengan keamanan dijamin lewat sandbox tingkat OS
Evolusi AI coding: dari code completion ke delegasi agen
- Dalam beberapa tahun terakhir, AI coding berkembang dari code completion (meningkatkan kecepatan mengetik sekitar 10%) → pair programming (merencanakan lintas file, menjalankan test, memodifikasi repo)
- Kedua pendekatan ini sama-sama berfokus pada menciptakan "kolaborator yang lebih baik", tetapi Codex mulai dikembangkan sejak setahun lalu dengan tujuan membangun agen yang bisa didelegasikan
- Pada Desember 2025, model GT 5.2 Codex mencapai kemampuan kerja jangka panjang tanpa henti dan steerability yang tinggi, sehingga mengatasi hambatan utama untuk "delegasi agen yang sesungguhnya"
- Setelah itu, performa terus meningkat lewat GT 5.3 yang lebih cepat dan efisien, lalu model terbaru GT 5.4
- Titik kemajuan utamanya adalah kemampuan menjelajahi codebase enterprise berskala besar secara stabil dan tetap selaras dengan maksud pengguna dalam durasi panjang
Antarmuka yang tersedia untuk Codex
- Codex memungkinkan satu agen digunakan di berbagai surface seperti CLI, ekstensi IDE, dan Codex app, semuanya berbagi backend yang sama
- Codex app adalah antarmuka paling visual untuk eksekusi paralel, dioptimalkan untuk menjalankan banyak agen sekaligus dan meninjau outputnya
- Studi kasus Peter Steinberger (pendiri OpenClaw): beralih dari mengelola lebih dari 10 jendela CLI ke Codex app untuk meningkatkan efisiensi manajemen agen paralel
- Mendukung macOS dan Windows, dapat diunduh dari openai.com/codex, dan di Windows juga tersedia lewat Microsoft Store
- Di CLI, login awal dilakukan dengan perintah
codex login, lalu sesi dimulai dengan perintah codex
UI dan pengaturan Codex app
- Dapat memilih model (seperti GPT 5.4) dan menyesuaikan reasoning effort: low, medium, high, extra high
- medium adalah default, dengan keseimbangan terbaik antara kecepatan dan kedalaman penalaran
- Untuk pertanyaan sederhana cocok memakai low, sedangkan untuk pemikiran mendalam jangka panjang cocok memakai high atau extra high
- Tersedia toggle Speed mode (fast/standard) untuk mengatur kecepatan respons
- Selain pekerjaan lokal, tersedia mode Git worktree dan opsi menjalankan cloud container jarak jauh
- Pengaturan izin: pilih antara izin default (membaca/mengedit file dalam proyek, meminta persetujuan untuk perintah berisiko) atau akses penuh (seluruh file komputer, akses jaringan, eksekusi tanpa persetujuan)
- Untuk pengguna baru, izin default direkomendasikan
- Proyek (folder) dapat ditambahkan dan dipindahkan dari sidebar kiri
Pemanfaatan Codex di seluruh tahap SDLC
- OpenAI menerbitkan panduan "Building an AI Native Engineering Team" yang merangkum cara agen coding mempercepat seluruh 7 tahap SDLC (plan, design, build, test, review, document, deploy/maintenance)
- Secara khusus, tahap test dan review menjadi semakin penting seiring peningkatan kemampuan generasi kode
- Codex dinilai sangat unggul terutama dalam penalaran di codebase kompleks dan penulisan kode tingkat production
Tahap Plan
- Dengan mengaktifkan Plan mode (
/plan atau Shift+Tab), Codex akan menyusun rencana terlebih dahulu sebelum implementasi
- Dalam demo, saat diminta merencanakan aplikasi companion iOS berbasis SwiftUI, Codex menjelajahi codebase lalu mengajukan pertanyaan lanjutan (metode autentikasi, cakupan rilis pertama, dll.)
- Agen dapat diarahkan dengan menerima opsi rekomendasi atau memasukkan instruksi sendiri
- Asumsi dalam rencana dinyatakan secara eksplisit agar pengguna bisa memverifikasi dan merevisinya
Tahap Design — integrasi MCP
- Melalui MCP(Model Context Protocol), konteks dari alat eksternal seperti Figma dan Linear dapat dihubungkan langsung ke Codex
- Didukung di semua antarmuka: CLI, ekstensi IDE, dan Codex app
- Dengan integrasi Figma MCP, saat menempelkan link desain, Codex mengambil konteks desain lalu mengubahnya menjadi kode
- Jika MCP belum dikonfigurasi, Codex otomatis menampilkan panduan instalasi
- Integrasi aplikasi ChatGPT juga dapat langsung digunakan di Codex melalui koneksi pihak ketiga
- Dengan ini, engineer bisa fokus pada logika inti, sementara desainer dapat mengalokasikan lebih banyak waktu untuk mengeksplorasi konsep desain
Tahap Build
- Tahap dengan dampak terbesar dari agen coding dalam SDLC
- Dalam demo, Codex menjalankan secara paralel perbaikan inefisiensi N+1 query dan penambahan regression test, audit rute API yang kehilangan autentikasi, serta migrasi dari NextAuth v4 ke Auth.js v5
- Hasil generasi kode berbasis desain Figma: perubahan pada 10 file, menulis 320 baris kode, tanpa perlu penulisan CSS manual
- Fitur Worktree otomatis membuat salinan proyek lokal untuk mencegah konflik antarpekerjaan paralel, tanpa perlu menyalin repositori secara terpisah
- Codex otomatis menjalankan perintah verifikasi, build, dan lint seperti
npx tsc dan npm test yang ditentukan di agents.md untuk memastikan kepatuhan pada konvensi tim
- Build itu sendiri bukan lagi bottleneck, dan di lingkungan enterprise yang utama adalah memverifikasi bahwa kode sesuai dengan aturan tim
- Terminal dapat dibuka langsung di dalam app dengan Command+J
- Untuk aplikasi iOS,
xcode build juga bisa dijalankan langsung di Codex app tanpa membuka Xcode secara langsung
Slash Commands
- CLI, ekstensi IDE, dan Codex app semuanya mendukung slash commands: plan mode, mention file, cek status sesi, ubah izin, dan lainnya
- Fitur eksperimental dapat ditoggle lewat perintah
/experimental
- Termasuk fitur pembuatan multi-agent (sub-agents)
- CLI sedikit lebih dulu mendapatkan fitur baru dibanding antarmuka lain
- Pengaturan yang ditoggle di satu antarmuka akan tercermin di semua antarmuka karena semuanya berbagi backend yang sama
Tahap Review
- Menjalankan code review lewat perintah
/review terhadap base branch atau perubahan lokal yang belum di-commit
- Agen Codex dilatih khusus untuk mengidentifikasi bug tingkat P0/P1, sehingga memberi umpan balik bernilai tinggi dengan noise rendah
- Isu dapat ditemukan lebih awal secara lokal sebelum PR mencapai pipeline CI/CD
- Integrasi native GitHub Cloud: Codex otomatis melakukan code review pada PR secara proaktif maupun reaktif
- Diperkenalkan contoh menangkap isu P1 yang mudah terlewat manusia, seperti peninjauan aturan regex
- SCM lain seperti GitLab dan Bitbucket dapat membangun integrasi langsung melalui Codex SDK
- Jika komentar review ditambahkan langsung di panel diff, komentar itu otomatis dimasukkan ke konteks percakapan berikutnya
Skills — packaging workflow yang dapat digunakan ulang
- Skill adalah standar terbuka untuk memaketkan instruksi workflow yang dapat dijalankan Codex
- Secara struktur berupa satu folder, dengan file wajib skill.md (metadata + instruksi agen)
- Secara opsional bisa ditambahkan script eksekusi, dokumentasi, dan template
- MCP juga dapat di-embed di dalam skill untuk integrasi alat eksternal
- Contoh demo: menangani komentar PR, memperbaiki kegagalan build BuildKite secara otomatis, mendeteksi dead code, dll.
- Skill Creator (system skill): saat diminta di percakapan seperti "create a skill to find dead code paths", otomatis melakukan scaffolding untuk skill.md
- Skill Installer (system skill): langsung menginstal skill yang dibuat ke direktori skill Codex lokal
- Jika workflow yang berulang setelah percakapan panjang diubah menjadi skill, maka berikutnya seluruh workflow dapat dijalankan dengan satu kali panggilan
- Contoh GitHub Issue Plan PR skill: dengan satu prompt, seluruh tahap SDLC dapat dijalankan sekaligus dari triage issue GitHub → plan → edit → dokumentasi → membuat draft PR
Tahap Documentation
- Salah satu area pemanfaatan Codex yang paling kurang diapresiasi
- Mendukung pembuatan diagram sistem, pembaruan dokumentasi otomatis saat fitur diimplementasikan, dan lainnya
- Diperlihatkan demo yang menggunakan Linear MCP untuk otomatis mendokumentasikan perubahan tiket tertentu, hasil regression test, dan riwayat verifikasi ke board Linear
Tahap Deploy & Maintenance
- Dari Codex app, Commit, Push, dan membuat PR dapat dilakukan langsung lewat klik tombol (berbasis Git)
- Jika stack trace ditempelkan, Codex menalar seluruh codebase untuk mencari penyebab isu
- Triage Page skill: saat ID insiden dimasukkan, skill ini menangani pengumpulan detail, konfirmasi insiden, pemeriksaan metrik dan log, hingga patch dalam satu alur
- Respons pager duty beralih dari analisis log manual ke delegasi pada agen
- PR Babysitter skill: terus memantau progres pipeline CI/CD dari PR, memperbaiki masalah secara otomatis saat muncul, dan akhirnya menyelesaikan hingga merge secara otomatis
- Sudah digunakan secara nyata di lingkungan monorepo besar OpenAI
- Dapat diunduh dari repositori skill open source
Automations — eksekusi otomatis berbasis jadwal
- Setelah terbiasa menggunakan skill, fitur Automations memungkinkan penjadwalan eksekusi tugas tertentu secara otomatis
- Otomatisasi Sentry skill: setiap Kamis (atau setiap hari), mencari isu di repositori tertentu lalu mengusulkan perbaikan atau memperbaikinya secara otomatis
- Otomatisasi "What is everyone up to?": setiap hari pukul 09.00 menampilkan ringkasan aktivitas anggota tim di repositori
- Tanpa perlu memasukkan prompt secara manual, Codex terus menjalankan pekerjaan di background
Cara kerja agen Codex
- Agen Codex bekerja dengan basis loop: pengguna memberi tujuan yang jelas dan arah awal → agen berulang kali melakukan penalaran, memanggil alat, membaca file, menelusuri repositori, menulis kode, dan menjalankan perintah
- Hasil dari setiap alat menjadi umpan balik untuk panggilan model berikutnya, sehingga pemahaman bertahap dan progres kerja terus dibangun
- Konteks (context) adalah variabel kunci yang menentukan performa agen: penting memberi jumlah input yang tepat untuk mengarahkan ke jalur yang benar
- Sandbox tingkat OS: bukan pembatas ringan pada level harness, tetapi kontrol akses jaringan dan file di level sistem operasi
- Dirancang untuk mengantisipasi kemungkinan model yang semakin maju dapat melewati perlindungan ringan
- Semua sistem (Mac, Windows) mendukung sandbox, dan di Windows diimplementasikan native Windows sandbox yang lebih aman daripada WSL
- File config TOML memungkinkan pengaturan detail approval mode (kapan meminta persetujuan) dan sandbox mode (cakupan akses)
- Default-nya adalah "on request", berjalan normal lalu berhenti sementara saat perlu eskalasi izin
Compaction — pengelolaan thread jangka panjang
- Saat percakapan mendekati batas konteks model, Codex melakukan compaction dengan memampatkan bagian awal percakapan
- Compaction diproses di sisi server berdasarkan chain of thought mentah, sehingga lebih baik mempertahankan isi pekerjaan yang substansial dibanding pendekatan client-side
- Contoh nyata: selama 25 jam kerja tanpa henti, Codex berhasil mempertahankan konteks sambil melakukan compaction 13–14 kali
Best practice prompting untuk delegasi yang efektif
- Gunakan prompt minimal yang tetap memuat tujuan yang jelas, batasan, dan kriteria "selesai"
- Tanamkan kondisi verifikasi ke dalam prompt: nyatakan kriteria sukses, test yang harus dijalankan, dan perintah build yang perlu dieksekusi
- Gunakan open-ended prompt: tanyakan ide peningkatan performa, area yang kurang test coverage, dan sebagainya untuk menjadikan Codex mitra berpikir
agents.md — file instruksi perilaku agen
- Format terbuka yang mirip dengan Rules di Cursor atau pengaturan di Windsurf, bukan milik eksklusif OpenAI
- Dimuat otomatis di semua sesi Codex dan membantu menghasilkan hasil yang konsisten
- Sistem prioritas 3 tingkat:
- Global (
~/.codex/agents.md): pengaturan default pribadi (tidak terkait tim)
- Root repositori (
agents.md): konvensi untuk seluruh repo
- Subdirektori (
agents.md): instruksi rinci per microservice/subfolder
- Codex menggabungkan (concatenate) agents.md sepanjang path dari root proyek ke direktori saat ini, dan file yang lebih spesifik diprioritaskan
- Isi yang disarankan: gambaran repo, perintah eksekusi, ekspektasi test, lokasi modul inti, panduan commit/PR
- Perintah
/init (CLI) dapat membuat agents.md awal secara otomatis, mengatasi masalah cold start
- Disarankan tetap ringkas di bawah 100 baris (berdasarkan agents.md monorepo internal OpenAI)
- Jika isinya makin panjang, pisahkan ke file Markdown per tugas (planning.md, code-review.md, architecture.md, dll.) lalu referensikan dari agents.md
- Diperkenalkan pola otomatisasi dengan meminta Codex menganalisis log sesi lokal (jalur simpan disediakan) untuk mengusulkan perbaikan agents.md setiap minggu
- Bisa juga meminta Codex melakukan retrospektif percakapan agar bagian gotcha atau catatan referensi otomatis ditambahkan ke agents.md
Penutup — 3 langkah praktis utama untuk mengadopsi Codex
- Buat agents.md dan susun konfigurasi kustom
- Berikan tugas kerja nyata kepada Codex, lalu hubungkan dengan alat (MCP) yang digunakan sehari-hari
- Jalankan Codex bukan hanya pada tahap build, tetapi di seluruh loop pengembangan dari design hingga deploy dan maintenance secara berulang
3 komentar
OpenAI Academy juga sudah dibuka hampir 1 tahun, jadi cukup banyak materi kuliah bagus yang sudah terkumpul.
(Tapi agak disayangkan karena hanya ada subtitle bahasa Inggris yang dibuat otomatis)
Sayang sekali, semoga ada subtitle bahasa Indonesia.
Ada yang sudah dengar ini?
Apakah cukup bermakna untuk menginvestasikan 1 jam?
Di era AI serba sekali klik, waktu jadi terasa berharga haha