OpenAI merilis aplikasi Codex untuk macOS

(openai.com)

12 poin oleh GN⁺ 2026-02-03 | 9 komentar | Bagikan ke WhatsApp

Mengelola beberapa agen AI secara bersamaan dan mendukung pekerjaan paralel serta kolaborasi jangka panjang dalam sebuah lingkungan pengembangan terintegrasi AI
Setiap agen berjalan di thread terpisah sehingga memungkinkan multitasking per proyek, review kode, komentar diff, dan perbaikan manual
Melalui fitur Skills, cakupan kerja meluas dari penulisan kode ke pengumpulan informasi, pemecahan masalah, pembuatan gambar, penulisan dokumen, hingga deployment cloud
Dengan fitur Automations, tugas berulang dapat dijalankan secara otomatis di latar belakang sesuai jadwal yang ditentukan
Secara default, keamanan sandbox diterapkan, dan perintah yang membutuhkan hak lebih tinggi seperti akses jaringan memerlukan persetujuan pengguna
Codex juga tersedia sementara untuk pengguna ChatGPT Free dan Go, sementara paket berbayar mendapat batas penggunaan 2x lebih besar

Gambaran umum aplikasi Codex: pusat komando untuk agen

Sejak peluncuran Codex pada April 2025, cara developer memanfaatkan agen telah berubah secara mendasar
- Model kini dapat menangani tugas yang kompleks dan jangka panjang dari awal hingga akhir
- Developer sekarang mengorkestrasi beberapa agen di seluruh proyek untuk mendelegasikan pekerjaan dan menjalankannya secara paralel
Tantangan inti bergeser dari "apa yang bisa dilakukan agen" menjadi "bagaimana manusia dapat mengarahkan, mengawasi, dan berkolaborasi dengan agen dalam skala besar"
IDE dan alat berbasis terminal yang ada tidak dirancang untuk mendukung cara kerja ini, sehingga dibutuhkan alat baru
Aplikasi Codex untuk macOS memungkinkan pengelolaan beberapa agen AI secara bersamaan dan menjalankan pekerjaan secara paralel
Mendukung tugas yang berjalan lama dan mengelola seluruh proses desain, pengembangan, deployment, hingga pemeliharaan perangkat lunak melalui kolaborasi antaragen

Pekerjaan paralel multi-agen

Aplikasi Codex menyediakan ruang fokus untuk multitasking bersama agen
- Agen berjalan di thread terpisah yang disusun per proyek, sehingga perpindahan antarpekerjaan dapat dilakukan tanpa kehilangan konteks
- Dalam thread, perubahan dari agen bisa ditinjau, diberi komentar pada diff, atau diperbaiki langsung di editor
Dukungan Worktrees bawaan memungkinkan banyak agen bekerja di repositori yang sama tanpa konflik
- Setiap agen bekerja pada salinan kode yang terisolasi sehingga dapat mengeksplorasi berbagai jalur tanpa memengaruhi status git lokal
- Selama agen bekerja, perubahan dapat di-checkout secara lokal atau pekerjaan dapat terus berjalan tanpa mengubah status git lokal
Riwayat sesi dan pengaturan dari Codex CLI serta ekstensi IDE diimpor otomatis, sehingga bisa langsung digunakan pada proyek yang sudah ada

Skills: perluasan melampaui pembuatan kode

Codex sedang berevolusi dari agen yang menulis kode menjadi agen yang menggunakan kode untuk menjalankan pekerjaan di komputer
Dengan Skills, kemampuannya dapat diperluas melampaui pembuatan kode ke pengumpulan dan sintesis informasi, pemecahan masalah, dan penulisan
- Instruksi, resource, dan skrip dapat dibundel sehingga Codex dapat terhubung ke alat dan menjalankan workflow
- Pekerjaan dapat diselesaikan secara andal sesuai preferensi tim
Iklan
Aplikasi Codex menyertakan antarmuka khusus untuk membuat dan mengelola Skills
- Bisa diminta secara eksplisit untuk menggunakan Skills tertentu, atau diatur agar digunakan otomatis sesuai tugas
Contoh penggunaan Skills: membuat game balap
- Codex diminta membuat game balap dengan berbagai pembalap, 8 peta, dan item yang bisa digunakan dengan tombol spasi
  - Menggunakan skill pembuatan gambar (berbasis GPT Image) dan skill pengembangan game web
  - Bekerja secara mandiri dengan lebih dari 7 juta token hanya dari satu prompt awal hingga game selesai
  - Berperan sebagai desainer, developer game, dan QA tester, lalu benar-benar memainkan game untuk memverifikasinya
- Nama game: Voxel Velocity, 3D voxel kart racer berbasis Three.js
  - Mode balapan tunggal (selalu 3 lap, 1 manusia vs 7 CPU, 8 lintasan langsung tersedia)
  - Model mengemudi arcade, sistem charge drift, tier boost (Tier 1 0.7 detik, Tier 2 1.1 detik, Tier 3 1.5 detik)
  - 8 karakter, 8 item, preset tingkat kesulitan CPU, implementasi spline AI
Skills utama yang disediakan
- Implement designs: mengambil konteks desain, aset, dan screenshot dari Figma lalu mengubahnya menjadi kode UI production dengan kesamaan visual 1:1
- Manage projects: klasifikasi bug, pelacakan rilis, dan pengelolaan beban kerja tim di Linear
- Deploy to the cloud: deployment web app ke host cloud utama seperti Cloudflare, Netlify, Render, dan Vercel
- Generate images: pembuatan dan pengeditan gambar berbasis GPT Image untuk website, mockup UI, visual produk, dan aset game
- Build with OpenAI APIs: merujuk ke dokumentasi terbaru saat membangun dengan OpenAI API
- Create documents: membaca, membuat, dan mengedit file PDF, spreadsheet, dan docx (dengan dukungan format serta layout profesional)
- Skill baru yang dibuat di aplikasi dapat digunakan di aplikasi, CLI, maupun ekstensi IDE
- Skills dapat di-check in ke repositori untuk dibagikan ke seluruh tim

Automations: otomatisasi tugas berulang

Dengan fitur Automations, Codex dapat menjalankan pekerjaan otomatis di latar belakang sesuai jadwal yang ditentukan
- Dikonfigurasi dengan menggabungkan instruksi dan Skills opsional
- Setelah selesai, hasil disimpan di antrean review sehingga pekerjaan bisa dilanjutkan bila diperlukan
Iklan
Contoh penggunaan internal di OpenAI
- Klasifikasi issue harian
- Menemukan dan merangkum kegagalan CI
- Membuat ringkasan rilis harian
- Verifikasi bug

Personality: menyesuaikan gaya kerja

Tiap developer memiliki preferensi berbeda dalam bekerja dengan agen
- Ada yang menginginkan partner yang ringkas dan berorientasi eksekusi
- Ada yang lebih menyukai interaksi yang lebih percakapan dan empatik
Di Codex, tersedia dua personality: gaya ringkas dan praktis vs gaya percakapan dan empatik
- Tidak mengubah fungsinya, hanya menyesuaikan dengan preferensi pengguna
- Dapat diatur di aplikasi, CLI, dan ekstensi IDE dengan perintah /personality

Keamanan: aktif secara default dan dapat dikonfigurasi

Keamanan terintegrasi sejak tahap desain di seluruh stack agen Codex
Sama seperti Codex CLI, menggunakan sandbox tingkat sistem yang native, open source, dan dapat dikonfigurasi
Pengaturan default
- Agen hanya diizinkan mengedit file pada folder atau branch yang sedang dikerjakan serta melakukan pencarian web yang telah di-cache
- Saat menjalankan perintah yang memerlukan hak lebih tinggi seperti akses jaringan, agen akan meminta persetujuan pengguna
Iklan
Aturan untuk proyek atau tim dapat dikonfigurasi agar perintah tertentu otomatis dijalankan dengan hak lebih tinggi

Ketersediaan dan harga

Aplikasi Codex tersedia mulai hari ini di macOS
Pelanggan ChatGPT Plus, Pro, Business, Enterprise, dan Edu dapat menggunakan Codex di CLI, web, ekstensi IDE, dan aplikasi dengan login ChatGPT
Penggunaan termasuk dalam langganan ChatGPT, dengan opsi membeli kredit tambahan bila diperlukan
Untuk sementara, Codex juga tersedia bagi pengguna ChatGPT Free dan Go
Selama periode ini, seluruh pengguna Codex yang sudah ada di paket berbayar mendapatkan batas penggunaan 2x lebih besar

Rencana ke depan

Sejak peluncuran GPT-5.2-Codex pada pertengahan Desember 2024, total penggunaan Codex telah meningkat 2x
Dalam satu bulan terakhir, lebih dari 1 juta developer telah menggunakan Codex
Rencana ke depan
- Aplikasi Windows akan hadir
- Perluasan frontier kemampuan model
- Inferensi yang lebih cepat
Peningkatan di dalam aplikasi
- Workflow multi-agen akan terus disempurnakan berdasarkan umpan balik nyata
- Pengelolaan pekerjaan paralel dan kemudahan menjaga konteks saat berpindah antaragen akan ditingkatkan
Ekspansi Automations
- Sedang dibangun dukungan trigger berbasis cloud
- Codex akan dapat terus berjalan di latar belakang meski komputer tidak sedang terbuka

Premis inti Codex

Berbasis pada premis sederhana bahwa segala sesuatu dikendalikan oleh kode
Semakin baik agen dalam bernalar tentang kode dan menghasilkannya, semakin kompeten pula ia dalam berbagai bentuk pekerjaan teknis dan pengetahuan
Tantangan inti saat ini: kesenjangan antara kemampuan model frontier dan sejauh mana manusia benar-benar bisa memakainya dengan mudah
Codex dirancang untuk menutup kesenjangan ini dengan memudahkan pengarahan, pengawasan, dan penerapan seluruh kecerdasan model ke pekerjaan nyata
Fokusnya adalah membangun agen coding terbaik, yang akan menjadi fondasi bagi agen kuat untuk pekerjaan pengetahuan yang jauh lebih luas

9 komentar

treestae 2026-02-03

Saya sudah mencobanya hari ini, dan ini benar-benar bagus.
Sepertinya fork-fork VSCode harus siap menghadapi kepunahan.
Tentu saja, bisa jadi lapangan kerja para developer juga akan berkurang.

m00nlygreat 2026-02-03

Windows tampaknya tidak memiliki teknologi sandbox, jadi sepertinya sulit untuk melakukan banyak hal.

cshj55 2026-02-03

Tolong kasih Wsl atau Windows...

xguru 2026-02-03

Saya juga belakangan ini menjadikan Codex sebagai yang utama, dan memang bagus. Semoga versi Windows juga cepat dirilis.

Saat pertama kali dimulai, aplikasi ini langsung mengimpor semua proyek yang sebelumnya dikerjakan di Codex dan menampilkannya berderet di sisi kiri berdasarkan proyek/thread, jadi sangat pas untuk menjalankan beberapa pekerjaan sekaligus.

tested 2026-02-03

Apakah ada alasan khusus mengapa yang utama adalah Codex, bukan Claude Code?

xguru 2026-02-03

Saya cenderung melempar dokumen rencana yang panjang dan menyuruhnya bekerja, dan Codex ternyata lebih cocok untuk kebutuhan seperti ini.
Dan memang, rate limit-nya jelas jarang kena. Padahal saya biasanya menjalankan beberapa proyek sekaligus di akun yang murah.

tested 2026-02-03

Ohong, terima kasih atas komentarnya.

Fakta bahwa pembuat OpenClaw juga memakai Codex juga begitu

MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Codex juga kelihatannya tidak mendapat penilaian buruk, tetapi kalau melihat komentar di Hacker News rasanya mungkin tidak juga...

unknowncyder 2026-02-03

Tolong dong 2222 versi Windows/Linux T_T
Saya juga ingin mencoba Atlas yang disebut sebagai browser ChatGPT, tapi setelah dibilang Windows coming soon, sudah lama tidak ada kabarnya.

GN⁺ 2026-02-03

Komentar Hacker News

Sulit dipahami kenapa perusahaan AI dengan dana miliaran dolar masih belum bisa membuat aplikasi native
Kebanyakan cuma setingkat UI chat sederhana, tetapi dengan Electron sulit memanggil API OS (misalnya Win32) secara langsung sehingga integrasi mendalam tidak memungkinkan
Software kompleks seperti Blender, Godot, Unity, dan UE5 saja semuanya berjalan secara native, jadi menyebalkan melihat perusahaan seperti ini hanya membuat alasan
- Lingkungan pengembangan desktop memang berantakan. Microsoft merilis terlalu banyak framework setengah matang, jadi orang tidak tahu harus memakai apa
  Di Windows, Electron pada dasarnya sudah menjadi standar, dan bahkan Microsoft sendiri sering memakainya
  macOS jauh lebih baik, tetapi pada akhirnya tim akan terkunci khusus Mac atau memilih Electron demi lintas platform
- Belakangan ini bahkan UI video game pun banyak yang berbasis HTML/JS
  UI UE5 juga hampir tidak terasa native, dan sulit dibilang lebih baik daripada Electron
  Di Electron juga tetap bisa memanggil API native
  Sebagian besar pengguna tidak peduli apakah aplikasi itu native atau tidak, dan dari sudut pandang perusahaan, keuntungan besarnya adalah developer web bisa dialihfungsikan untuk pengembangan aplikasi desktop
- Saya justru melihatnya sebaliknya. Kalau semuanya dibuat sebagai antarmuka teks, model bisa mempelajari tool secara alami
  TUI atau GUI adalah lapisan abstraksi yang tidak perlu dan justru menyulitkan otomasi
  Intinya adalah pemanggilan perintah sederhana dan pencatatan log. [mode headless atau log sesi] lebih dekat ke arah itu
- Kenyataannya, hasil buatan AI pada akhirnya cuma jadi aplikasi Electron dengan satu kotak input
- Saya tidak paham fitur apa dari aplikasi native yang dianggap begitu penting
  Kebanyakan orang tidak peduli apakah aplikasi dibuat dengan teknologi web
  Berkat Electron, porting ke Linux juga jadi mudah. Kalau memaksa native saja, hal seperti itu mungkin tidak akan terjadi
Saya cukup banyak memakai Codex selama dua bulan terakhir, dan hasilnya cukup mengesankan
Memang belum sempurna, tetapi secara konsisten menghasilkan output setara engineer tingkat menengah
Hanya saja aplikasinya macet di “Loading projects…”
Tautan dokumentasinya juga sempat rusak, tetapi tautan ini sekarang sudah berfungsi
Saya memakai beberapa lingkungan VM lewat VS Code Remote, jadi sepertinya perlu sedikit mengubah pengaturan port offset
- Saya memakai ChatGPT($20/bulan) dan Claude($200/tahun) bersamaan, dan Codex belum pernah kena batas penggunaan
  Codex sering terjebak dalam loop saat memecahkan masalah, dan Claude cukup bagus untuk merapikannya sampai selesai
  Memakai kedua model secara bergantian ternyata cukup efisien
- Saya mendapat balasan ucapan terima kasih karena sudah melaporkan masalah tautan itu. Katanya kecepatan loading juga sedang diperbaiki
- Codex kuat untuk backend atau pekerjaan yang logis, tetapi untuk pekerjaan UI frontend sederhana sering membuat kesalahan
  Meski begitu, karena terus membaik, saya tetap menaruh harapan
- Saya akan tetap memakai Cursor. OpenAI seharusnya fokus memperbaiki bug di aplikasi yang ada daripada merilis aplikasi baru
Codex terlihat seperti produk pesaing sejenis Claude Cowork
Cowork memanggil Claude Code di VM, sedangkan Codex menjalankan CLI di sandbox OS
Stack teknologinya terdiri dari Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, dan lain-lain
Untuk macOS, digunakan juga Sparkle, Squirrel, Sentry
- Dari namanya dan desain yang berpusat pada diff/worktree, terlihat sangat berorientasi pada developer
- Agak mengecewakan karena stack-nya terasa setingkat bootcamp
- Saya penasaran apakah integrasi Sentry itu native atau lewat MCP
- Adanya tampilan git dan terminal menjadi kelebihan besar bagi pengguna CLI. Saya juga menantikan fitur skills
Saya sudah mencoba Codex, dan saking lambat dan bodohnya sampai bikin marah
Tidak mengikuti instruksi, berhenti di tengah jalan, atau melempar kode aneh
Karena tidak punya data terbaru terkait Nuxt 4+, aplikasi ini terus menghasilkan error
Fitur Undo juga tidak bekerja dengan benar, dan tidak ada umpan balik
Claude Code menyelesaikan tugas yang sama dalam sekali jalan, sedangkan Codex lama dan hasilnya berantakan
Ini mengingatkan saya pada saat memakai Nokia N800 dulu: ada potensi, tetapi tingkat kematangannya terlalu rendah sehingga membuat saya khawatir dengan arah OpenAI
Codex dari OpenAI pada dasarnya adalah versi resmi dari produk seperti Emdash dan Conductor
Saya penasaran apakah Anthropic juga akan merilis aplikasi multi-agent Claude Code yang serupa
- Sudah ada Claude Code Desktop
- Pendekatan multi-agent sepertinya agak terlalu dilebih-lebihkan
  Jika ada kontrak yang jelas (seperti definisi API), bekerja paralel dalam sesi independen akan lebih efisien
- Saat memakai Claude Code lewat GUI, saya penasaran apakah yang dipakai adalah keseluruhan Claude Code harness atau hanya modelnya saja
- Saya baru pertama kali mendengar Emdash, tetapi tool seperti ini terlalu banyak sampai sulit dipromosikan dan pasarnya berisik
  Saya sendiri hampir sempat membuat sesuatu yang mirip
- Versi web Claude Code sudah dirilis sebagai research preview
Fitur agent tidak terlalu menarik bagi saya
Inti dari paper Recursive Language Models adalah mengelola requirement, desain, rencana, dan sebagainya sebagai objek immutable, bukan sebagai konteks
Saya mengelola tiap tahap (spec, analysis, plan, dan seterusnya) dalam file .md, lalu menjalankannya dengan proses kanban yang memiliki tahap persetujuan
Dengan cara ini, semuanya berjalan baik bahkan tanpa UI, kualitas kode tetap terjaga, dan dalam jangka panjang kecepatan pengembangan menjadi 10 kali lebih cepat
Tampaknya fitur utama Codex adalah menjalankan agent secara paralel, tetapi saya sudah memakainya seperti itu di Claude Code selama 9 bulan
Dengan .claude/commands dan .claude/agents, beberapa pekerjaan bisa dijalankan bersamaan
Codex cukup bagus dalam menangkap hal-hal yang terlewat oleh Claude, dan memakai kedua model secara saling melengkapi membuat kerja lebih efisien
Keunggulan Codex adalah murah dan batas pemakaiannya nyaris tak terbatas, sementara Claude punya kualitas lebih tinggi
Saya terutama memakai Claude Code, tetapi orkestrator terbaik yang pernah saya pakai adalah Zenflow dari Zencoder.ai
Prosesnya disusun berdasarkan plan.md, dan langkah atau hook bisa ditambahkan secara dinamis
Karena otomatisasi workflow dapat dikendalikan berbasis dokumen, penggunaannya terasa praktis
- Tapi kalau dicari-cari, sering kali ternyata cuma aplikasi lain yang menjual “paket kredit AI”
  Saya sudah membayar untuk tiga model utama, jadi saya rasa layanan seperti ini tidak akan bertahan lama
- Sudah ada lebih dari 500 layanan integrasi AI
Di bagian bawah demo game “Voxel Velocity” tertulis “Enter start”, tetapi sebenarnya Enter hanya mengubah pilihan
Katanya mereka memakai 7 juta token, jadi mengejutkan bahwa kesalahan QA seperti ini tidak tertangkap
- Gamenya sendiri mengesankan, tetapi dalam detail-detail kecil kontrol kualitasnya terasa kurang
  Masalah halus seperti ini sulit ditangkap dengan test harness atau agent QA
- Hampir tidak ada perbedaan fitur game antara versi 60 ribu, 800 ribu, dan 7 juta token
  Walau tokennya bertambah, yang meningkat hanya tingkat penyelesaiannya, sedangkan gameplay-nya sama. Jadi saya penasaran sebenarnya token tambahan itu dipakai untuk apa
Saya pengguna Linux, jadi sayang sekali Codex khusus Mac
Saya penasaran apakah versi CLI juga direncanakan akan mendukung fungsi yang sama
- Romain dari OpenAI menjawab langsung. Karena berbasis Electron, dukungan Windows dan Linux juga akan segera ditambahkan
- Saat ini bahkan di Mac pun tidak berjalan pada chip Intel
- macOS cocok untuk eksperimen. Karena konfigurasi hardwarenya seragam, bug edge case lebih sedikit
Disayangkan semuanya hanya berjalan secara lokal
Akan bagus jika ada fitur cluster terkelola yang bisa berjalan hanya di jaringan internal
Idealnya juga memungkinkan berbagi progres pekerjaan dengan anggota tim
- Saya memakai hal serupa dengan ssh dan tmux
  Akan jauh lebih nyaman kalau fitur seperti ini didukung langsung di level tool
OpenAI dan Codex memang memimpin inovasi awal, tetapi sekarang Claude dan Gemini terasa lebih unggul
Kualitas GPT-5.x belakangan juga menurun, dan dalam pengumuman kali ini yang dirilis hanya versi khusus Mac, yang cukup disayangkan
Artikelnya juga penuh salah ketik, dan saya juga tidak puas karena prompt yang benar-benar dipakai tidak dibagikan
Meski begitu, kalau membaik saya tetap bersedia mencobanya lagi
- Di videonya terlihat jelas bagian pembuatan kode diedit sangat cepat, lebih dari 5x
  Mungkin karena orang sudah terbiasa dengan kecepatan Sonnet atau Gemini 3.0 Flash
- Saya justru merasa Codex lebih stabil untuk menangani pekerjaan kompleks dibanding Claude Code atau Gemini
  ChatGPT $20 lebih efisien daripada Claude $200
- Kebijakan peluncuran macOS lebih dulu juga sudah pernah dilakukan OpenAI sebelumnya