12 poin oleh GN⁺ 2026-02-03 | 8 komentar | Bagikan ke WhatsApp
  • Mengelola beberapa agen AI secara bersamaan dan mendukung pekerjaan paralel serta kolaborasi jangka panjang dalam sebuah lingkungan pengembangan terintegrasi AI
  • Setiap agen berjalan di thread terpisah sehingga memungkinkan multitasking per proyek, review kode, komentar diff, dan perbaikan manual
  • Melalui fitur Skills, cakupan kerja meluas dari penulisan kode ke pengumpulan informasi, pemecahan masalah, pembuatan gambar, penulisan dokumen, hingga deployment cloud
  • Dengan fitur Automations, tugas berulang dapat dijalankan secara otomatis di latar belakang sesuai jadwal yang ditentukan
  • Secara default, keamanan sandbox diterapkan, dan perintah yang membutuhkan hak lebih tinggi seperti akses jaringan memerlukan persetujuan pengguna
  • Codex juga tersedia sementara untuk pengguna ChatGPT Free dan Go, sementara paket berbayar mendapat batas penggunaan 2x lebih besar

Gambaran umum aplikasi Codex: pusat komando untuk agen

  • Sejak peluncuran Codex pada April 2025, cara developer memanfaatkan agen telah berubah secara mendasar
    • Model kini dapat menangani tugas yang kompleks dan jangka panjang dari awal hingga akhir
    • Developer sekarang mengorkestrasi beberapa agen di seluruh proyek untuk mendelegasikan pekerjaan dan menjalankannya secara paralel
  • Tantangan inti bergeser dari "apa yang bisa dilakukan agen" menjadi "bagaimana manusia dapat mengarahkan, mengawasi, dan berkolaborasi dengan agen dalam skala besar"
  • IDE dan alat berbasis terminal yang ada tidak dirancang untuk mendukung cara kerja ini, sehingga dibutuhkan alat baru
  • Aplikasi Codex untuk macOS memungkinkan pengelolaan beberapa agen AI secara bersamaan dan menjalankan pekerjaan secara paralel
  • Mendukung tugas yang berjalan lama dan mengelola seluruh proses desain, pengembangan, deployment, hingga pemeliharaan perangkat lunak melalui kolaborasi antaragen

Pekerjaan paralel multi-agen

  • Aplikasi Codex menyediakan ruang fokus untuk multitasking bersama agen
    • Agen berjalan di thread terpisah yang disusun per proyek, sehingga perpindahan antarpekerjaan dapat dilakukan tanpa kehilangan konteks
    • Dalam thread, perubahan dari agen bisa ditinjau, diberi komentar pada diff, atau diperbaiki langsung di editor
  • Dukungan Worktrees bawaan memungkinkan banyak agen bekerja di repositori yang sama tanpa konflik
    • Setiap agen bekerja pada salinan kode yang terisolasi sehingga dapat mengeksplorasi berbagai jalur tanpa memengaruhi status git lokal
    • Selama agen bekerja, perubahan dapat di-checkout secara lokal atau pekerjaan dapat terus berjalan tanpa mengubah status git lokal
  • Riwayat sesi dan pengaturan dari Codex CLI serta ekstensi IDE diimpor otomatis, sehingga bisa langsung digunakan pada proyek yang sudah ada

Skills: perluasan melampaui pembuatan kode

  • Codex sedang berevolusi dari agen yang menulis kode menjadi agen yang menggunakan kode untuk menjalankan pekerjaan di komputer
  • Dengan Skills, kemampuannya dapat diperluas melampaui pembuatan kode ke pengumpulan dan sintesis informasi, pemecahan masalah, dan penulisan
    • Instruksi, resource, dan skrip dapat dibundel sehingga Codex dapat terhubung ke alat dan menjalankan workflow
    • Pekerjaan dapat diselesaikan secara andal sesuai preferensi tim
  • Aplikasi Codex menyertakan antarmuka khusus untuk membuat dan mengelola Skills
    • Bisa diminta secara eksplisit untuk menggunakan Skills tertentu, atau diatur agar digunakan otomatis sesuai tugas
  • Contoh penggunaan Skills: membuat game balap

    • Codex diminta membuat game balap dengan berbagai pembalap, 8 peta, dan item yang bisa digunakan dengan tombol spasi
      • Menggunakan skill pembuatan gambar (berbasis GPT Image) dan skill pengembangan game web
      • Bekerja secara mandiri dengan lebih dari 7 juta token hanya dari satu prompt awal hingga game selesai
      • Berperan sebagai desainer, developer game, dan QA tester, lalu benar-benar memainkan game untuk memverifikasinya
    • Nama game: Voxel Velocity, 3D voxel kart racer berbasis Three.js
      • Mode balapan tunggal (selalu 3 lap, 1 manusia vs 7 CPU, 8 lintasan langsung tersedia)
      • Model mengemudi arcade, sistem charge drift, tier boost (Tier 1 0.7 detik, Tier 2 1.1 detik, Tier 3 1.5 detik)
      • 8 karakter, 8 item, preset tingkat kesulitan CPU, implementasi spline AI
  • Skills utama yang disediakan

    • Implement designs: mengambil konteks desain, aset, dan screenshot dari Figma lalu mengubahnya menjadi kode UI production dengan kesamaan visual 1:1
    • Manage projects: klasifikasi bug, pelacakan rilis, dan pengelolaan beban kerja tim di Linear
    • Deploy to the cloud: deployment web app ke host cloud utama seperti Cloudflare, Netlify, Render, dan Vercel
    • Generate images: pembuatan dan pengeditan gambar berbasis GPT Image untuk website, mockup UI, visual produk, dan aset game
    • Build with OpenAI APIs: merujuk ke dokumentasi terbaru saat membangun dengan OpenAI API
    • Create documents: membaca, membuat, dan mengedit file PDF, spreadsheet, dan docx (dengan dukungan format serta layout profesional)
    • Skill baru yang dibuat di aplikasi dapat digunakan di aplikasi, CLI, maupun ekstensi IDE
    • Skills dapat di-check in ke repositori untuk dibagikan ke seluruh tim

Automations: otomatisasi tugas berulang

  • Dengan fitur Automations, Codex dapat menjalankan pekerjaan otomatis di latar belakang sesuai jadwal yang ditentukan
    • Dikonfigurasi dengan menggabungkan instruksi dan Skills opsional
    • Setelah selesai, hasil disimpan di antrean review sehingga pekerjaan bisa dilanjutkan bila diperlukan
  • Contoh penggunaan internal di OpenAI
    • Klasifikasi issue harian
    • Menemukan dan merangkum kegagalan CI
    • Membuat ringkasan rilis harian
    • Verifikasi bug

Personality: menyesuaikan gaya kerja

  • Tiap developer memiliki preferensi berbeda dalam bekerja dengan agen
    • Ada yang menginginkan partner yang ringkas dan berorientasi eksekusi
    • Ada yang lebih menyukai interaksi yang lebih percakapan dan empatik
  • Di Codex, tersedia dua personality: gaya ringkas dan praktis vs gaya percakapan dan empatik
    • Tidak mengubah fungsinya, hanya menyesuaikan dengan preferensi pengguna
    • Dapat diatur di aplikasi, CLI, dan ekstensi IDE dengan perintah /personality

Keamanan: aktif secara default dan dapat dikonfigurasi

  • Keamanan terintegrasi sejak tahap desain di seluruh stack agen Codex
  • Sama seperti Codex CLI, menggunakan sandbox tingkat sistem yang native, open source, dan dapat dikonfigurasi
  • Pengaturan default
    • Agen hanya diizinkan mengedit file pada folder atau branch yang sedang dikerjakan serta melakukan pencarian web yang telah di-cache
    • Saat menjalankan perintah yang memerlukan hak lebih tinggi seperti akses jaringan, agen akan meminta persetujuan pengguna
  • Aturan untuk proyek atau tim dapat dikonfigurasi agar perintah tertentu otomatis dijalankan dengan hak lebih tinggi

Ketersediaan dan harga

  • Aplikasi Codex tersedia mulai hari ini di macOS
  • Pelanggan ChatGPT Plus, Pro, Business, Enterprise, dan Edu dapat menggunakan Codex di CLI, web, ekstensi IDE, dan aplikasi dengan login ChatGPT
  • Penggunaan termasuk dalam langganan ChatGPT, dengan opsi membeli kredit tambahan bila diperlukan
  • Untuk sementara, Codex juga tersedia bagi pengguna ChatGPT Free dan Go
  • Selama periode ini, seluruh pengguna Codex yang sudah ada di paket berbayar mendapatkan batas penggunaan 2x lebih besar

Rencana ke depan

  • Sejak peluncuran GPT-5.2-Codex pada pertengahan Desember 2024, total penggunaan Codex telah meningkat 2x
  • Dalam satu bulan terakhir, lebih dari 1 juta developer telah menggunakan Codex
  • Rencana ke depan
    • Aplikasi Windows akan hadir
    • Perluasan frontier kemampuan model
    • Inferensi yang lebih cepat
  • Peningkatan di dalam aplikasi
    • Workflow multi-agen akan terus disempurnakan berdasarkan umpan balik nyata
    • Pengelolaan pekerjaan paralel dan kemudahan menjaga konteks saat berpindah antaragen akan ditingkatkan
  • Ekspansi Automations
    • Sedang dibangun dukungan trigger berbasis cloud
    • Codex akan dapat terus berjalan di latar belakang meski komputer tidak sedang terbuka

Premis inti Codex

  • Berbasis pada premis sederhana bahwa segala sesuatu dikendalikan oleh kode
  • Semakin baik agen dalam bernalar tentang kode dan menghasilkannya, semakin kompeten pula ia dalam berbagai bentuk pekerjaan teknis dan pengetahuan
  • Tantangan inti saat ini: kesenjangan antara kemampuan model frontier dan sejauh mana manusia benar-benar bisa memakainya dengan mudah
  • Codex dirancang untuk menutup kesenjangan ini dengan memudahkan pengarahan, pengawasan, dan penerapan seluruh kecerdasan model ke pekerjaan nyata
  • Fokusnya adalah membangun agen coding terbaik, yang akan menjadi fondasi bagi agen kuat untuk pekerjaan pengetahuan yang jauh lebih luas

8 komentar

 
xguru 2026-02-03

Saya juga belakangan ini menjadikan Codex sebagai yang utama, dan memang bagus. Semoga versi Windows juga cepat dirilis.

Saat pertama kali dimulai, aplikasi ini langsung mengimpor semua proyek yang sebelumnya dikerjakan di Codex dan menampilkannya berderet di sisi kiri berdasarkan proyek/thread, jadi sangat pas untuk menjalankan beberapa pekerjaan sekaligus.

 
tested 2026-02-03

Apakah ada alasan khusus mengapa yang utama adalah Codex, bukan Claude Code?

 
xguru 2026-02-03

Saya cenderung melempar dokumen rencana yang panjang dan menyuruhnya bekerja, dan Codex ternyata lebih cocok untuk kebutuhan seperti ini.
Dan memang, rate limit-nya jelas jarang kena. Padahal saya biasanya menjalankan beberapa proyek sekaligus di akun yang murah.

 
tested 2026-02-03

Ohong, terima kasih atas komentarnya.

Fakta bahwa pembuat OpenClaw juga memakai Codex juga begitu
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Codex juga kelihatannya tidak mendapat penilaian buruk, tetapi kalau melihat komentar di Hacker News rasanya mungkin tidak juga...

 
treestae 2026-02-03

Saya sudah mencobanya hari ini, dan ini benar-benar bagus.
Sepertinya fork-fork VSCode harus siap menghadapi kepunahan.
Tentu saja, bisa jadi lapangan kerja para developer juga akan berkurang.

 
m00nlygreat 2026-02-03

Windows tampaknya tidak memiliki teknologi sandbox, jadi sepertinya sulit untuk melakukan banyak hal.

 
cshj55 2026-02-03

Tolong kasih Wsl atau Windows...

 
GN⁺ 2026-02-03
Komentar Hacker News
  • Sulit dipahami kenapa perusahaan AI dengan dana miliaran dolar masih belum bisa membuat aplikasi native
    Kebanyakan cuma setingkat UI chat sederhana, tetapi dengan Electron sulit memanggil API OS (misalnya Win32) secara langsung sehingga integrasi mendalam tidak memungkinkan
    Software kompleks seperti Blender, Godot, Unity, dan UE5 saja semuanya berjalan secara native, jadi menyebalkan melihat perusahaan seperti ini hanya membuat alasan
    • Lingkungan pengembangan desktop memang berantakan. Microsoft merilis terlalu banyak framework setengah matang, jadi orang tidak tahu harus memakai apa
      Di Windows, Electron pada dasarnya sudah menjadi standar, dan bahkan Microsoft sendiri sering memakainya
      macOS jauh lebih baik, tetapi pada akhirnya tim akan terkunci khusus Mac atau memilih Electron demi lintas platform
    • Belakangan ini bahkan UI video game pun banyak yang berbasis HTML/JS
      UI UE5 juga hampir tidak terasa native, dan sulit dibilang lebih baik daripada Electron
      Di Electron juga tetap bisa memanggil API native
      Sebagian besar pengguna tidak peduli apakah aplikasi itu native atau tidak, dan dari sudut pandang perusahaan, keuntungan besarnya adalah developer web bisa dialihfungsikan untuk pengembangan aplikasi desktop
    • Saya justru melihatnya sebaliknya. Kalau semuanya dibuat sebagai antarmuka teks, model bisa mempelajari tool secara alami
      TUI atau GUI adalah lapisan abstraksi yang tidak perlu dan justru menyulitkan otomasi
      Intinya adalah pemanggilan perintah sederhana dan pencatatan log. [mode headless atau log sesi] lebih dekat ke arah itu
    • Kenyataannya, hasil buatan AI pada akhirnya cuma jadi aplikasi Electron dengan satu kotak input
    • Saya tidak paham fitur apa dari aplikasi native yang dianggap begitu penting
      Kebanyakan orang tidak peduli apakah aplikasi dibuat dengan teknologi web
      Berkat Electron, porting ke Linux juga jadi mudah. Kalau memaksa native saja, hal seperti itu mungkin tidak akan terjadi
  • Saya cukup banyak memakai Codex selama dua bulan terakhir, dan hasilnya cukup mengesankan
    Memang belum sempurna, tetapi secara konsisten menghasilkan output setara engineer tingkat menengah
    Hanya saja aplikasinya macet di “Loading projects…”
    Tautan dokumentasinya juga sempat rusak, tetapi tautan ini sekarang sudah berfungsi
    Saya memakai beberapa lingkungan VM lewat VS Code Remote, jadi sepertinya perlu sedikit mengubah pengaturan port offset
    • Saya memakai ChatGPT($20/bulan) dan Claude($200/tahun) bersamaan, dan Codex belum pernah kena batas penggunaan
      Codex sering terjebak dalam loop saat memecahkan masalah, dan Claude cukup bagus untuk merapikannya sampai selesai
      Memakai kedua model secara bergantian ternyata cukup efisien
    • Saya mendapat balasan ucapan terima kasih karena sudah melaporkan masalah tautan itu. Katanya kecepatan loading juga sedang diperbaiki
    • Codex kuat untuk backend atau pekerjaan yang logis, tetapi untuk pekerjaan UI frontend sederhana sering membuat kesalahan
      Meski begitu, karena terus membaik, saya tetap menaruh harapan
    • Saya akan tetap memakai Cursor. OpenAI seharusnya fokus memperbaiki bug di aplikasi yang ada daripada merilis aplikasi baru
  • Codex terlihat seperti produk pesaing sejenis Claude Cowork
    Cowork memanggil Claude Code di VM, sedangkan Codex menjalankan CLI di sandbox OS
    Stack teknologinya terdiri dari Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, dan lain-lain
    Untuk macOS, digunakan juga Sparkle, Squirrel, Sentry
    • Dari namanya dan desain yang berpusat pada diff/worktree, terlihat sangat berorientasi pada developer
    • Agak mengecewakan karena stack-nya terasa setingkat bootcamp
    • Saya penasaran apakah integrasi Sentry itu native atau lewat MCP
    • Adanya tampilan git dan terminal menjadi kelebihan besar bagi pengguna CLI. Saya juga menantikan fitur skills
  • Saya sudah mencoba Codex, dan saking lambat dan bodohnya sampai bikin marah
    Tidak mengikuti instruksi, berhenti di tengah jalan, atau melempar kode aneh
    Karena tidak punya data terbaru terkait Nuxt 4+, aplikasi ini terus menghasilkan error
    Fitur Undo juga tidak bekerja dengan benar, dan tidak ada umpan balik
    Claude Code menyelesaikan tugas yang sama dalam sekali jalan, sedangkan Codex lama dan hasilnya berantakan
    Ini mengingatkan saya pada saat memakai Nokia N800 dulu: ada potensi, tetapi tingkat kematangannya terlalu rendah sehingga membuat saya khawatir dengan arah OpenAI
  • Codex dari OpenAI pada dasarnya adalah versi resmi dari produk seperti Emdash dan Conductor
    Saya penasaran apakah Anthropic juga akan merilis aplikasi multi-agent Claude Code yang serupa
    • Sudah ada Claude Code Desktop
    • Pendekatan multi-agent sepertinya agak terlalu dilebih-lebihkan
      Jika ada kontrak yang jelas (seperti definisi API), bekerja paralel dalam sesi independen akan lebih efisien
    • Saat memakai Claude Code lewat GUI, saya penasaran apakah yang dipakai adalah keseluruhan Claude Code harness atau hanya modelnya saja
    • Saya baru pertama kali mendengar Emdash, tetapi tool seperti ini terlalu banyak sampai sulit dipromosikan dan pasarnya berisik
      Saya sendiri hampir sempat membuat sesuatu yang mirip
    • Versi web Claude Code sudah dirilis sebagai research preview
  • Fitur agent tidak terlalu menarik bagi saya
    Inti dari paper Recursive Language Models adalah mengelola requirement, desain, rencana, dan sebagainya sebagai objek immutable, bukan sebagai konteks
    Saya mengelola tiap tahap (spec, analysis, plan, dan seterusnya) dalam file .md, lalu menjalankannya dengan proses kanban yang memiliki tahap persetujuan
    Dengan cara ini, semuanya berjalan baik bahkan tanpa UI, kualitas kode tetap terjaga, dan dalam jangka panjang kecepatan pengembangan menjadi 10 kali lebih cepat
  • Tampaknya fitur utama Codex adalah menjalankan agent secara paralel, tetapi saya sudah memakainya seperti itu di Claude Code selama 9 bulan
    Dengan .claude/commands dan .claude/agents, beberapa pekerjaan bisa dijalankan bersamaan
    Codex cukup bagus dalam menangkap hal-hal yang terlewat oleh Claude, dan memakai kedua model secara saling melengkapi membuat kerja lebih efisien
    Keunggulan Codex adalah murah dan batas pemakaiannya nyaris tak terbatas, sementara Claude punya kualitas lebih tinggi
  • Saya terutama memakai Claude Code, tetapi orkestrator terbaik yang pernah saya pakai adalah Zenflow dari Zencoder.ai
    Prosesnya disusun berdasarkan plan.md, dan langkah atau hook bisa ditambahkan secara dinamis
    Karena otomatisasi workflow dapat dikendalikan berbasis dokumen, penggunaannya terasa praktis
    • Tapi kalau dicari-cari, sering kali ternyata cuma aplikasi lain yang menjual “paket kredit AI”
      Saya sudah membayar untuk tiga model utama, jadi saya rasa layanan seperti ini tidak akan bertahan lama
    • Sudah ada lebih dari 500 layanan integrasi AI
  • Di bagian bawah demo game “Voxel Velocity” tertulis “Enter start”, tetapi sebenarnya Enter hanya mengubah pilihan
    Katanya mereka memakai 7 juta token, jadi mengejutkan bahwa kesalahan QA seperti ini tidak tertangkap
    • Gamenya sendiri mengesankan, tetapi dalam detail-detail kecil kontrol kualitasnya terasa kurang
      Masalah halus seperti ini sulit ditangkap dengan test harness atau agent QA
    • Hampir tidak ada perbedaan fitur game antara versi 60 ribu, 800 ribu, dan 7 juta token
      Walau tokennya bertambah, yang meningkat hanya tingkat penyelesaiannya, sedangkan gameplay-nya sama. Jadi saya penasaran sebenarnya token tambahan itu dipakai untuk apa
  • Saya pengguna Linux, jadi sayang sekali Codex khusus Mac
    Saya penasaran apakah versi CLI juga direncanakan akan mendukung fungsi yang sama
    • Romain dari OpenAI menjawab langsung. Karena berbasis Electron, dukungan Windows dan Linux juga akan segera ditambahkan
    • Saat ini bahkan di Mac pun tidak berjalan pada chip Intel
    • macOS cocok untuk eksperimen. Karena konfigurasi hardwarenya seragam, bug edge case lebih sedikit
  • Disayangkan semuanya hanya berjalan secara lokal
    Akan bagus jika ada fitur cluster terkelola yang bisa berjalan hanya di jaringan internal
    Idealnya juga memungkinkan berbagi progres pekerjaan dengan anggota tim
    • Saya memakai hal serupa dengan ssh dan tmux
      Akan jauh lebih nyaman kalau fitur seperti ini didukung langsung di level tool
  • OpenAI dan Codex memang memimpin inovasi awal, tetapi sekarang Claude dan Gemini terasa lebih unggul
    Kualitas GPT-5.x belakangan juga menurun, dan dalam pengumuman kali ini yang dirilis hanya versi khusus Mac, yang cukup disayangkan
    Artikelnya juga penuh salah ketik, dan saya juga tidak puas karena prompt yang benar-benar dipakai tidak dibagikan
    Meski begitu, kalau membaik saya tetap bersedia mencobanya lagi
    • Di videonya terlihat jelas bagian pembuatan kode diedit sangat cepat, lebih dari 5x
      Mungkin karena orang sudah terbiasa dengan kecepatan Sonnet atau Gemini 3.0 Flash
    • Saya justru merasa Codex lebih stabil untuk menangani pekerjaan kompleks dibanding Claude Code atau Gemini
      ChatGPT $20 lebih efisien daripada Claude $200
    • Kebijakan peluncuran macOS lebih dulu juga sudah pernah dilakukan OpenAI sebelumnya