- Mengelola beberapa agen AI secara bersamaan dan mendukung pekerjaan paralel serta kolaborasi jangka panjang dalam sebuah lingkungan pengembangan terintegrasi AI
- Setiap agen berjalan di thread terpisah sehingga memungkinkan multitasking per proyek, review kode, komentar diff, dan perbaikan manual
- Melalui fitur Skills, cakupan kerja meluas dari penulisan kode ke pengumpulan informasi, pemecahan masalah, pembuatan gambar, penulisan dokumen, hingga deployment cloud
- Dengan fitur Automations, tugas berulang dapat dijalankan secara otomatis di latar belakang sesuai jadwal yang ditentukan
- Secara default, keamanan sandbox diterapkan, dan perintah yang membutuhkan hak lebih tinggi seperti akses jaringan memerlukan persetujuan pengguna
- Codex juga tersedia sementara untuk pengguna ChatGPT Free dan Go, sementara paket berbayar mendapat batas penggunaan 2x lebih besar
Gambaran umum aplikasi Codex: pusat komando untuk agen
- Sejak peluncuran Codex pada April 2025, cara developer memanfaatkan agen telah berubah secara mendasar
- Model kini dapat menangani tugas yang kompleks dan jangka panjang dari awal hingga akhir
- Developer sekarang mengorkestrasi beberapa agen di seluruh proyek untuk mendelegasikan pekerjaan dan menjalankannya secara paralel
- Tantangan inti bergeser dari "apa yang bisa dilakukan agen" menjadi "bagaimana manusia dapat mengarahkan, mengawasi, dan berkolaborasi dengan agen dalam skala besar"
- IDE dan alat berbasis terminal yang ada tidak dirancang untuk mendukung cara kerja ini, sehingga dibutuhkan alat baru
- Aplikasi Codex untuk macOS memungkinkan pengelolaan beberapa agen AI secara bersamaan dan menjalankan pekerjaan secara paralel
- Mendukung tugas yang berjalan lama dan mengelola seluruh proses desain, pengembangan, deployment, hingga pemeliharaan perangkat lunak melalui kolaborasi antaragen
Pekerjaan paralel multi-agen
- Aplikasi Codex menyediakan ruang fokus untuk multitasking bersama agen
- Agen berjalan di thread terpisah yang disusun per proyek, sehingga perpindahan antarpekerjaan dapat dilakukan tanpa kehilangan konteks
- Dalam thread, perubahan dari agen bisa ditinjau, diberi komentar pada diff, atau diperbaiki langsung di editor
- Dukungan Worktrees bawaan memungkinkan banyak agen bekerja di repositori yang sama tanpa konflik
- Setiap agen bekerja pada salinan kode yang terisolasi sehingga dapat mengeksplorasi berbagai jalur tanpa memengaruhi status git lokal
- Selama agen bekerja, perubahan dapat di-checkout secara lokal atau pekerjaan dapat terus berjalan tanpa mengubah status git lokal
- Riwayat sesi dan pengaturan dari Codex CLI serta ekstensi IDE diimpor otomatis, sehingga bisa langsung digunakan pada proyek yang sudah ada
Skills: perluasan melampaui pembuatan kode
- Codex sedang berevolusi dari agen yang menulis kode menjadi agen yang menggunakan kode untuk menjalankan pekerjaan di komputer
- Dengan Skills, kemampuannya dapat diperluas melampaui pembuatan kode ke pengumpulan dan sintesis informasi, pemecahan masalah, dan penulisan
- Instruksi, resource, dan skrip dapat dibundel sehingga Codex dapat terhubung ke alat dan menjalankan workflow
- Pekerjaan dapat diselesaikan secara andal sesuai preferensi tim
- Aplikasi Codex menyertakan antarmuka khusus untuk membuat dan mengelola Skills
- Bisa diminta secara eksplisit untuk menggunakan Skills tertentu, atau diatur agar digunakan otomatis sesuai tugas
-
Contoh penggunaan Skills: membuat game balap
- Codex diminta membuat game balap dengan berbagai pembalap, 8 peta, dan item yang bisa digunakan dengan tombol spasi
- Menggunakan skill pembuatan gambar (berbasis GPT Image) dan skill pengembangan game web
- Bekerja secara mandiri dengan lebih dari 7 juta token hanya dari satu prompt awal hingga game selesai
- Berperan sebagai desainer, developer game, dan QA tester, lalu benar-benar memainkan game untuk memverifikasinya
- Nama game: Voxel Velocity, 3D voxel kart racer berbasis Three.js
- Mode balapan tunggal (selalu 3 lap, 1 manusia vs 7 CPU, 8 lintasan langsung tersedia)
- Model mengemudi arcade, sistem charge drift, tier boost (Tier 1 0.7 detik, Tier 2 1.1 detik, Tier 3 1.5 detik)
- 8 karakter, 8 item, preset tingkat kesulitan CPU, implementasi spline AI
-
Skills utama yang disediakan
- Implement designs: mengambil konteks desain, aset, dan screenshot dari Figma lalu mengubahnya menjadi kode UI production dengan kesamaan visual 1:1
- Manage projects: klasifikasi bug, pelacakan rilis, dan pengelolaan beban kerja tim di Linear
- Deploy to the cloud: deployment web app ke host cloud utama seperti Cloudflare, Netlify, Render, dan Vercel
- Generate images: pembuatan dan pengeditan gambar berbasis GPT Image untuk website, mockup UI, visual produk, dan aset game
- Build with OpenAI APIs: merujuk ke dokumentasi terbaru saat membangun dengan OpenAI API
- Create documents: membaca, membuat, dan mengedit file PDF, spreadsheet, dan docx (dengan dukungan format serta layout profesional)
- Skill baru yang dibuat di aplikasi dapat digunakan di aplikasi, CLI, maupun ekstensi IDE
- Skills dapat di-check in ke repositori untuk dibagikan ke seluruh tim
Automations: otomatisasi tugas berulang
- Dengan fitur Automations, Codex dapat menjalankan pekerjaan otomatis di latar belakang sesuai jadwal yang ditentukan
- Dikonfigurasi dengan menggabungkan instruksi dan Skills opsional
- Setelah selesai, hasil disimpan di antrean review sehingga pekerjaan bisa dilanjutkan bila diperlukan
- Contoh penggunaan internal di OpenAI
- Klasifikasi issue harian
- Menemukan dan merangkum kegagalan CI
- Membuat ringkasan rilis harian
- Verifikasi bug
Personality: menyesuaikan gaya kerja
- Tiap developer memiliki preferensi berbeda dalam bekerja dengan agen
- Ada yang menginginkan partner yang ringkas dan berorientasi eksekusi
- Ada yang lebih menyukai interaksi yang lebih percakapan dan empatik
- Di Codex, tersedia dua personality: gaya ringkas dan praktis vs gaya percakapan dan empatik
- Tidak mengubah fungsinya, hanya menyesuaikan dengan preferensi pengguna
- Dapat diatur di aplikasi, CLI, dan ekstensi IDE dengan perintah /personality
Keamanan: aktif secara default dan dapat dikonfigurasi
- Keamanan terintegrasi sejak tahap desain di seluruh stack agen Codex
- Sama seperti Codex CLI, menggunakan sandbox tingkat sistem yang native, open source, dan dapat dikonfigurasi
- Pengaturan default
- Agen hanya diizinkan mengedit file pada folder atau branch yang sedang dikerjakan serta melakukan pencarian web yang telah di-cache
- Saat menjalankan perintah yang memerlukan hak lebih tinggi seperti akses jaringan, agen akan meminta persetujuan pengguna
- Aturan untuk proyek atau tim dapat dikonfigurasi agar perintah tertentu otomatis dijalankan dengan hak lebih tinggi
Ketersediaan dan harga
- Aplikasi Codex tersedia mulai hari ini di macOS
- Pelanggan ChatGPT Plus, Pro, Business, Enterprise, dan Edu dapat menggunakan Codex di CLI, web, ekstensi IDE, dan aplikasi dengan login ChatGPT
- Penggunaan termasuk dalam langganan ChatGPT, dengan opsi membeli kredit tambahan bila diperlukan
- Untuk sementara, Codex juga tersedia bagi pengguna ChatGPT Free dan Go
- Selama periode ini, seluruh pengguna Codex yang sudah ada di paket berbayar mendapatkan batas penggunaan 2x lebih besar
Rencana ke depan
- Sejak peluncuran GPT-5.2-Codex pada pertengahan Desember 2024, total penggunaan Codex telah meningkat 2x
- Dalam satu bulan terakhir, lebih dari 1 juta developer telah menggunakan Codex
- Rencana ke depan
- Aplikasi Windows akan hadir
- Perluasan frontier kemampuan model
- Inferensi yang lebih cepat
- Peningkatan di dalam aplikasi
- Workflow multi-agen akan terus disempurnakan berdasarkan umpan balik nyata
- Pengelolaan pekerjaan paralel dan kemudahan menjaga konteks saat berpindah antaragen akan ditingkatkan
- Ekspansi Automations
- Sedang dibangun dukungan trigger berbasis cloud
- Codex akan dapat terus berjalan di latar belakang meski komputer tidak sedang terbuka
Premis inti Codex
- Berbasis pada premis sederhana bahwa segala sesuatu dikendalikan oleh kode
- Semakin baik agen dalam bernalar tentang kode dan menghasilkannya, semakin kompeten pula ia dalam berbagai bentuk pekerjaan teknis dan pengetahuan
- Tantangan inti saat ini: kesenjangan antara kemampuan model frontier dan sejauh mana manusia benar-benar bisa memakainya dengan mudah
- Codex dirancang untuk menutup kesenjangan ini dengan memudahkan pengarahan, pengawasan, dan penerapan seluruh kecerdasan model ke pekerjaan nyata
- Fokusnya adalah membangun agen coding terbaik, yang akan menjadi fondasi bagi agen kuat untuk pekerjaan pengetahuan yang jauh lebih luas
8 komentar
Saya juga belakangan ini menjadikan Codex sebagai yang utama, dan memang bagus. Semoga versi Windows juga cepat dirilis.
Saat pertama kali dimulai, aplikasi ini langsung mengimpor semua proyek yang sebelumnya dikerjakan di Codex dan menampilkannya berderet di sisi kiri berdasarkan proyek/thread, jadi sangat pas untuk menjalankan beberapa pekerjaan sekaligus.
Apakah ada alasan khusus mengapa yang utama adalah Codex, bukan Claude Code?
Saya cenderung melempar dokumen rencana yang panjang dan menyuruhnya bekerja, dan Codex ternyata lebih cocok untuk kebutuhan seperti ini.
Dan memang, rate limit-nya jelas jarang kena. Padahal saya biasanya menjalankan beberapa proyek sekaligus di akun yang murah.
Ohong, terima kasih atas komentarnya.
Fakta bahwa pembuat OpenClaw juga memakai Codex juga begitu
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”
Codex juga kelihatannya tidak mendapat penilaian buruk, tetapi kalau melihat komentar di Hacker News rasanya mungkin tidak juga...
Saya sudah mencobanya hari ini, dan ini benar-benar bagus.
Sepertinya fork-fork VSCode harus siap menghadapi kepunahan.
Tentu saja, bisa jadi lapangan kerja para developer juga akan berkurang.
Windows tampaknya tidak memiliki teknologi sandbox, jadi sepertinya sulit untuk melakukan banyak hal.
Tolong kasih Wsl atau Windows...
Komentar Hacker News
Kebanyakan cuma setingkat UI chat sederhana, tetapi dengan Electron sulit memanggil API OS (misalnya Win32) secara langsung sehingga integrasi mendalam tidak memungkinkan
Software kompleks seperti Blender, Godot, Unity, dan UE5 saja semuanya berjalan secara native, jadi menyebalkan melihat perusahaan seperti ini hanya membuat alasan
Di Windows, Electron pada dasarnya sudah menjadi standar, dan bahkan Microsoft sendiri sering memakainya
macOS jauh lebih baik, tetapi pada akhirnya tim akan terkunci khusus Mac atau memilih Electron demi lintas platform
UI UE5 juga hampir tidak terasa native, dan sulit dibilang lebih baik daripada Electron
Di Electron juga tetap bisa memanggil API native
Sebagian besar pengguna tidak peduli apakah aplikasi itu native atau tidak, dan dari sudut pandang perusahaan, keuntungan besarnya adalah developer web bisa dialihfungsikan untuk pengembangan aplikasi desktop
TUI atau GUI adalah lapisan abstraksi yang tidak perlu dan justru menyulitkan otomasi
Intinya adalah pemanggilan perintah sederhana dan pencatatan log. [mode headless atau log sesi] lebih dekat ke arah itu
Kebanyakan orang tidak peduli apakah aplikasi dibuat dengan teknologi web
Berkat Electron, porting ke Linux juga jadi mudah. Kalau memaksa native saja, hal seperti itu mungkin tidak akan terjadi
Memang belum sempurna, tetapi secara konsisten menghasilkan output setara engineer tingkat menengah
Hanya saja aplikasinya macet di “Loading projects…”
Tautan dokumentasinya juga sempat rusak, tetapi tautan ini sekarang sudah berfungsi
Saya memakai beberapa lingkungan VM lewat VS Code Remote, jadi sepertinya perlu sedikit mengubah pengaturan port offset
Codex sering terjebak dalam loop saat memecahkan masalah, dan Claude cukup bagus untuk merapikannya sampai selesai
Memakai kedua model secara bergantian ternyata cukup efisien
Meski begitu, karena terus membaik, saya tetap menaruh harapan
Cowork memanggil Claude Code di VM, sedangkan Codex menjalankan CLI di sandbox OS
Stack teknologinya terdiri dari Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, dan lain-lain
Untuk macOS, digunakan juga Sparkle, Squirrel, Sentry
Tidak mengikuti instruksi, berhenti di tengah jalan, atau melempar kode aneh
Karena tidak punya data terbaru terkait Nuxt 4+, aplikasi ini terus menghasilkan error
Fitur Undo juga tidak bekerja dengan benar, dan tidak ada umpan balik
Claude Code menyelesaikan tugas yang sama dalam sekali jalan, sedangkan Codex lama dan hasilnya berantakan
Ini mengingatkan saya pada saat memakai Nokia N800 dulu: ada potensi, tetapi tingkat kematangannya terlalu rendah sehingga membuat saya khawatir dengan arah OpenAI
Saya penasaran apakah Anthropic juga akan merilis aplikasi multi-agent Claude Code yang serupa
Jika ada kontrak yang jelas (seperti definisi API), bekerja paralel dalam sesi independen akan lebih efisien
Saya sendiri hampir sempat membuat sesuatu yang mirip
Inti dari paper Recursive Language Models adalah mengelola requirement, desain, rencana, dan sebagainya sebagai objek immutable, bukan sebagai konteks
Saya mengelola tiap tahap (spec, analysis, plan, dan seterusnya) dalam file .md, lalu menjalankannya dengan proses kanban yang memiliki tahap persetujuan
Dengan cara ini, semuanya berjalan baik bahkan tanpa UI, kualitas kode tetap terjaga, dan dalam jangka panjang kecepatan pengembangan menjadi 10 kali lebih cepat
Dengan
.claude/commandsdan.claude/agents, beberapa pekerjaan bisa dijalankan bersamaanCodex cukup bagus dalam menangkap hal-hal yang terlewat oleh Claude, dan memakai kedua model secara saling melengkapi membuat kerja lebih efisien
Keunggulan Codex adalah murah dan batas pemakaiannya nyaris tak terbatas, sementara Claude punya kualitas lebih tinggi
Prosesnya disusun berdasarkan plan.md, dan langkah atau hook bisa ditambahkan secara dinamis
Karena otomatisasi workflow dapat dikendalikan berbasis dokumen, penggunaannya terasa praktis
Saya sudah membayar untuk tiga model utama, jadi saya rasa layanan seperti ini tidak akan bertahan lama
Katanya mereka memakai 7 juta token, jadi mengejutkan bahwa kesalahan QA seperti ini tidak tertangkap
Masalah halus seperti ini sulit ditangkap dengan test harness atau agent QA
Walau tokennya bertambah, yang meningkat hanya tingkat penyelesaiannya, sedangkan gameplay-nya sama. Jadi saya penasaran sebenarnya token tambahan itu dipakai untuk apa
Saya penasaran apakah versi CLI juga direncanakan akan mendukung fungsi yang sama
Akan bagus jika ada fitur cluster terkelola yang bisa berjalan hanya di jaringan internal
Idealnya juga memungkinkan berbagi progres pekerjaan dengan anggota tim
Akan jauh lebih nyaman kalau fitur seperti ini didukung langsung di level tool
Kualitas GPT-5.x belakangan juga menurun, dan dalam pengumuman kali ini yang dirilis hanya versi khusus Mac, yang cukup disayangkan
Artikelnya juga penuh salah ketik, dan saya juga tidak puas karena prompt yang benar-benar dipakai tidak dibagikan
Meski begitu, kalau membaik saya tetap bersedia mencobanya lagi
Mungkin karena orang sudah terbiasa dengan kecepatan Sonnet atau Gemini 3.0 Flash
ChatGPT $20 lebih efisien daripada Claude $200