69 poin oleh GN⁺ 2026-03-19 | 3 komentar | Bagikan ke WhatsApp
  • Video webinar kuliah Codex untuk developer yang dirilis langsung oleh OpenAI (58 menit)
  • Codex adalah platform agen coding yang dirancang bukan sekadar untuk penyelesaian kode atau pair programming, tetapi agar engineer dapat mendelegasikan pekerjaan berskala besar kepada agen
  • Codex app, CLI, ekstensi IDE, dan berbagai antarmuka lain berbagi backend yang sama, serta dapat menjalankan banyak tugas secara paralel
  • Mencakup seluruh siklus hidup pengembangan perangkat lunak (SDLC), mulai dari Plan, Design, Build, Test, Review, Document, hingga Deploy & Maintenance
  • Melalui file agents.md, instruksi perilaku agen dapat diatur per repositori, dan workflow berulang bisa dipaketkan dengan Skills dan Automations untuk dijalankan secara otomatis
  • Mendukung pekerjaan tanpa henti selama 25 jam dan mempertahankan konteks jangka panjang melalui 13–14 kali server-side compaction, dengan keamanan dijamin lewat sandbox tingkat OS

Evolusi AI coding: dari code completion ke delegasi agen

  • Dalam beberapa tahun terakhir, AI coding berkembang dari code completion (meningkatkan kecepatan mengetik sekitar 10%) → pair programming (merencanakan lintas file, menjalankan test, memodifikasi repo)
  • Kedua pendekatan ini sama-sama berfokus pada menciptakan "kolaborator yang lebih baik", tetapi Codex mulai dikembangkan sejak setahun lalu dengan tujuan membangun agen yang bisa didelegasikan
  • Pada Desember 2025, model GT 5.2 Codex mencapai kemampuan kerja jangka panjang tanpa henti dan steerability yang tinggi, sehingga mengatasi hambatan utama untuk "delegasi agen yang sesungguhnya"
  • Setelah itu, performa terus meningkat lewat GT 5.3 yang lebih cepat dan efisien, lalu model terbaru GT 5.4
  • Titik kemajuan utamanya adalah kemampuan menjelajahi codebase enterprise berskala besar secara stabil dan tetap selaras dengan maksud pengguna dalam durasi panjang

Antarmuka yang tersedia untuk Codex

  • Codex memungkinkan satu agen digunakan di berbagai surface seperti CLI, ekstensi IDE, dan Codex app, semuanya berbagi backend yang sama
  • Codex app adalah antarmuka paling visual untuk eksekusi paralel, dioptimalkan untuk menjalankan banyak agen sekaligus dan meninjau outputnya
  • Studi kasus Peter Steinberger (pendiri OpenClaw): beralih dari mengelola lebih dari 10 jendela CLI ke Codex app untuk meningkatkan efisiensi manajemen agen paralel
  • Mendukung macOS dan Windows, dapat diunduh dari openai.com/codex, dan di Windows juga tersedia lewat Microsoft Store
  • Di CLI, login awal dilakukan dengan perintah codex login, lalu sesi dimulai dengan perintah codex

UI dan pengaturan Codex app

  • Dapat memilih model (seperti GPT 5.4) dan menyesuaikan reasoning effort: low, medium, high, extra high
    • medium adalah default, dengan keseimbangan terbaik antara kecepatan dan kedalaman penalaran
    • Untuk pertanyaan sederhana cocok memakai low, sedangkan untuk pemikiran mendalam jangka panjang cocok memakai high atau extra high
  • Tersedia toggle Speed mode (fast/standard) untuk mengatur kecepatan respons
  • Selain pekerjaan lokal, tersedia mode Git worktree dan opsi menjalankan cloud container jarak jauh
  • Pengaturan izin: pilih antara izin default (membaca/mengedit file dalam proyek, meminta persetujuan untuk perintah berisiko) atau akses penuh (seluruh file komputer, akses jaringan, eksekusi tanpa persetujuan)
    • Untuk pengguna baru, izin default direkomendasikan
  • Proyek (folder) dapat ditambahkan dan dipindahkan dari sidebar kiri

Pemanfaatan Codex di seluruh tahap SDLC

  • OpenAI menerbitkan panduan "Building an AI Native Engineering Team" yang merangkum cara agen coding mempercepat seluruh 7 tahap SDLC (plan, design, build, test, review, document, deploy/maintenance)
  • Secara khusus, tahap test dan review menjadi semakin penting seiring peningkatan kemampuan generasi kode
  • Codex dinilai sangat unggul terutama dalam penalaran di codebase kompleks dan penulisan kode tingkat production

Tahap Plan

  • Dengan mengaktifkan Plan mode (/plan atau Shift+Tab), Codex akan menyusun rencana terlebih dahulu sebelum implementasi
  • Dalam demo, saat diminta merencanakan aplikasi companion iOS berbasis SwiftUI, Codex menjelajahi codebase lalu mengajukan pertanyaan lanjutan (metode autentikasi, cakupan rilis pertama, dll.)
  • Agen dapat diarahkan dengan menerima opsi rekomendasi atau memasukkan instruksi sendiri
  • Asumsi dalam rencana dinyatakan secara eksplisit agar pengguna bisa memverifikasi dan merevisinya

Tahap Design — integrasi MCP

  • Melalui MCP(Model Context Protocol), konteks dari alat eksternal seperti Figma dan Linear dapat dihubungkan langsung ke Codex
    • Didukung di semua antarmuka: CLI, ekstensi IDE, dan Codex app
  • Dengan integrasi Figma MCP, saat menempelkan link desain, Codex mengambil konteks desain lalu mengubahnya menjadi kode
    • Jika MCP belum dikonfigurasi, Codex otomatis menampilkan panduan instalasi
  • Integrasi aplikasi ChatGPT juga dapat langsung digunakan di Codex melalui koneksi pihak ketiga
  • Dengan ini, engineer bisa fokus pada logika inti, sementara desainer dapat mengalokasikan lebih banyak waktu untuk mengeksplorasi konsep desain

Tahap Build

  • Tahap dengan dampak terbesar dari agen coding dalam SDLC
  • Dalam demo, Codex menjalankan secara paralel perbaikan inefisiensi N+1 query dan penambahan regression test, audit rute API yang kehilangan autentikasi, serta migrasi dari NextAuth v4 ke Auth.js v5
  • Hasil generasi kode berbasis desain Figma: perubahan pada 10 file, menulis 320 baris kode, tanpa perlu penulisan CSS manual
  • Fitur Worktree otomatis membuat salinan proyek lokal untuk mencegah konflik antarpekerjaan paralel, tanpa perlu menyalin repositori secara terpisah
  • Codex otomatis menjalankan perintah verifikasi, build, dan lint seperti npx tsc dan npm test yang ditentukan di agents.md untuk memastikan kepatuhan pada konvensi tim
  • Build itu sendiri bukan lagi bottleneck, dan di lingkungan enterprise yang utama adalah memverifikasi bahwa kode sesuai dengan aturan tim
  • Terminal dapat dibuka langsung di dalam app dengan Command+J
  • Untuk aplikasi iOS, xcode build juga bisa dijalankan langsung di Codex app tanpa membuka Xcode secara langsung

Slash Commands

  • CLI, ekstensi IDE, dan Codex app semuanya mendukung slash commands: plan mode, mention file, cek status sesi, ubah izin, dan lainnya
  • Fitur eksperimental dapat ditoggle lewat perintah /experimental
    • Termasuk fitur pembuatan multi-agent (sub-agents)
    • CLI sedikit lebih dulu mendapatkan fitur baru dibanding antarmuka lain
  • Pengaturan yang ditoggle di satu antarmuka akan tercermin di semua antarmuka karena semuanya berbagi backend yang sama

Tahap Review

  • Menjalankan code review lewat perintah /review terhadap base branch atau perubahan lokal yang belum di-commit
  • Agen Codex dilatih khusus untuk mengidentifikasi bug tingkat P0/P1, sehingga memberi umpan balik bernilai tinggi dengan noise rendah
  • Isu dapat ditemukan lebih awal secara lokal sebelum PR mencapai pipeline CI/CD
  • Integrasi native GitHub Cloud: Codex otomatis melakukan code review pada PR secara proaktif maupun reaktif
    • Diperkenalkan contoh menangkap isu P1 yang mudah terlewat manusia, seperti peninjauan aturan regex
  • SCM lain seperti GitLab dan Bitbucket dapat membangun integrasi langsung melalui Codex SDK
  • Jika komentar review ditambahkan langsung di panel diff, komentar itu otomatis dimasukkan ke konteks percakapan berikutnya

Skills — packaging workflow yang dapat digunakan ulang

  • Skill adalah standar terbuka untuk memaketkan instruksi workflow yang dapat dijalankan Codex
    • Secara struktur berupa satu folder, dengan file wajib skill.md (metadata + instruksi agen)
    • Secara opsional bisa ditambahkan script eksekusi, dokumentasi, dan template
  • MCP juga dapat di-embed di dalam skill untuk integrasi alat eksternal
  • Contoh demo: menangani komentar PR, memperbaiki kegagalan build BuildKite secara otomatis, mendeteksi dead code, dll.
  • Skill Creator (system skill): saat diminta di percakapan seperti "create a skill to find dead code paths", otomatis melakukan scaffolding untuk skill.md
  • Skill Installer (system skill): langsung menginstal skill yang dibuat ke direktori skill Codex lokal
  • Jika workflow yang berulang setelah percakapan panjang diubah menjadi skill, maka berikutnya seluruh workflow dapat dijalankan dengan satu kali panggilan
  • Contoh GitHub Issue Plan PR skill: dengan satu prompt, seluruh tahap SDLC dapat dijalankan sekaligus dari triage issue GitHub → plan → edit → dokumentasi → membuat draft PR

Tahap Documentation

  • Salah satu area pemanfaatan Codex yang paling kurang diapresiasi
  • Mendukung pembuatan diagram sistem, pembaruan dokumentasi otomatis saat fitur diimplementasikan, dan lainnya
  • Diperlihatkan demo yang menggunakan Linear MCP untuk otomatis mendokumentasikan perubahan tiket tertentu, hasil regression test, dan riwayat verifikasi ke board Linear

Tahap Deploy & Maintenance

  • Dari Codex app, Commit, Push, dan membuat PR dapat dilakukan langsung lewat klik tombol (berbasis Git)
  • Jika stack trace ditempelkan, Codex menalar seluruh codebase untuk mencari penyebab isu
  • Triage Page skill: saat ID insiden dimasukkan, skill ini menangani pengumpulan detail, konfirmasi insiden, pemeriksaan metrik dan log, hingga patch dalam satu alur
    • Respons pager duty beralih dari analisis log manual ke delegasi pada agen
  • PR Babysitter skill: terus memantau progres pipeline CI/CD dari PR, memperbaiki masalah secara otomatis saat muncul, dan akhirnya menyelesaikan hingga merge secara otomatis
    • Sudah digunakan secara nyata di lingkungan monorepo besar OpenAI
    • Dapat diunduh dari repositori skill open source

Automations — eksekusi otomatis berbasis jadwal

  • Setelah terbiasa menggunakan skill, fitur Automations memungkinkan penjadwalan eksekusi tugas tertentu secara otomatis
  • Otomatisasi Sentry skill: setiap Kamis (atau setiap hari), mencari isu di repositori tertentu lalu mengusulkan perbaikan atau memperbaikinya secara otomatis
  • Otomatisasi "What is everyone up to?": setiap hari pukul 09.00 menampilkan ringkasan aktivitas anggota tim di repositori
  • Tanpa perlu memasukkan prompt secara manual, Codex terus menjalankan pekerjaan di background

Cara kerja agen Codex

  • Agen Codex bekerja dengan basis loop: pengguna memberi tujuan yang jelas dan arah awal → agen berulang kali melakukan penalaran, memanggil alat, membaca file, menelusuri repositori, menulis kode, dan menjalankan perintah
  • Hasil dari setiap alat menjadi umpan balik untuk panggilan model berikutnya, sehingga pemahaman bertahap dan progres kerja terus dibangun
  • Konteks (context) adalah variabel kunci yang menentukan performa agen: penting memberi jumlah input yang tepat untuk mengarahkan ke jalur yang benar
  • Sandbox tingkat OS: bukan pembatas ringan pada level harness, tetapi kontrol akses jaringan dan file di level sistem operasi
    • Dirancang untuk mengantisipasi kemungkinan model yang semakin maju dapat melewati perlindungan ringan
    • Semua sistem (Mac, Windows) mendukung sandbox, dan di Windows diimplementasikan native Windows sandbox yang lebih aman daripada WSL
  • File config TOML memungkinkan pengaturan detail approval mode (kapan meminta persetujuan) dan sandbox mode (cakupan akses)
    • Default-nya adalah "on request", berjalan normal lalu berhenti sementara saat perlu eskalasi izin

Compaction — pengelolaan thread jangka panjang

  • Saat percakapan mendekati batas konteks model, Codex melakukan compaction dengan memampatkan bagian awal percakapan
  • Compaction diproses di sisi server berdasarkan chain of thought mentah, sehingga lebih baik mempertahankan isi pekerjaan yang substansial dibanding pendekatan client-side
  • Contoh nyata: selama 25 jam kerja tanpa henti, Codex berhasil mempertahankan konteks sambil melakukan compaction 13–14 kali

Best practice prompting untuk delegasi yang efektif

  • Gunakan prompt minimal yang tetap memuat tujuan yang jelas, batasan, dan kriteria "selesai"
  • Tanamkan kondisi verifikasi ke dalam prompt: nyatakan kriteria sukses, test yang harus dijalankan, dan perintah build yang perlu dieksekusi
  • Gunakan open-ended prompt: tanyakan ide peningkatan performa, area yang kurang test coverage, dan sebagainya untuk menjadikan Codex mitra berpikir

agents.md — file instruksi perilaku agen

  • Format terbuka yang mirip dengan Rules di Cursor atau pengaturan di Windsurf, bukan milik eksklusif OpenAI
  • Dimuat otomatis di semua sesi Codex dan membantu menghasilkan hasil yang konsisten
  • Sistem prioritas 3 tingkat:
    • Global (~/.codex/agents.md): pengaturan default pribadi (tidak terkait tim)
    • Root repositori (agents.md): konvensi untuk seluruh repo
    • Subdirektori (agents.md): instruksi rinci per microservice/subfolder
    • Codex menggabungkan (concatenate) agents.md sepanjang path dari root proyek ke direktori saat ini, dan file yang lebih spesifik diprioritaskan
  • Isi yang disarankan: gambaran repo, perintah eksekusi, ekspektasi test, lokasi modul inti, panduan commit/PR
  • Perintah /init (CLI) dapat membuat agents.md awal secara otomatis, mengatasi masalah cold start
  • Disarankan tetap ringkas di bawah 100 baris (berdasarkan agents.md monorepo internal OpenAI)
  • Jika isinya makin panjang, pisahkan ke file Markdown per tugas (planning.md, code-review.md, architecture.md, dll.) lalu referensikan dari agents.md
  • Diperkenalkan pola otomatisasi dengan meminta Codex menganalisis log sesi lokal (jalur simpan disediakan) untuk mengusulkan perbaikan agents.md setiap minggu
  • Bisa juga meminta Codex melakukan retrospektif percakapan agar bagian gotcha atau catatan referensi otomatis ditambahkan ke agents.md

Penutup — 3 langkah praktis utama untuk mengadopsi Codex

  • Buat agents.md dan susun konfigurasi kustom
  • Berikan tugas kerja nyata kepada Codex, lalu hubungkan dengan alat (MCP) yang digunakan sehari-hari
  • Jalankan Codex bukan hanya pada tahap build, tetapi di seluruh loop pengembangan dari design hingga deploy dan maintenance secara berulang

3 komentar

 
xguru 2026-03-19

OpenAI Academy juga sudah dibuka hampir 1 tahun, jadi cukup banyak materi kuliah bagus yang sudah terkumpul.
(Tapi agak disayangkan karena hanya ada subtitle bahasa Inggris yang dibuat otomatis)

 
mindok 2026-03-20

Sayang sekali, semoga ada subtitle bahasa Indonesia.

 
j2sus91 2026-03-19

Ada yang sudah dengar ini?
Apakah cukup bermakna untuk menginvestasikan 1 jam?

Di era AI serba sekali klik, waktu jadi terasa berharga haha