Setelah bergulat dengan Claude selama beberapa bulan, Codex terasa seperti mimpi bagi vibe coder
(reddit.com)- Selama 3 bulan coding dengan Claude/Anthropic, tetapi keandalannya menurun pada pekerjaan skala repo sehingga diperlukan workflow pemantauan terpisah
- Pada era 4.7, model berhalusinasi mengaku pekerjaan sudah selesai padahal implementasi nyatanya hanya sekitar 40%, atau menunjukkan kepercayaan diri berlebihan di sekitar stub/placeholder
- Meski membayar biaya Max x20, yang terasa justru konsumsi token dan beban supervisi lebih besar daripada produktivitas
- Codex lebih baik memahami kode yang berdekatan tanpa prompt berlebihan, menangkap regresi, sehingga loop lint/test dan refactor skala besar menjadi bisa dikelola
- Migrasi praktis selesai hanya dengan memindahkan CLAUDE.md→AGENTS.md dan mempertahankan hooks, dan untuk workflow ini tidak ada niat untuk kembali
Alur pengembangan yang berubah setelah beralih dari Claude ke Codex
- Selama 3 bulan terakhir, penulis terutama coding dengan Claude/Anthropic, dan saat Opus 4.6 dirilis, keunggulannya terasa pada pemahaman arsitektur, penanganan konteks besar, dan implementasi fitur yang cepat
- Seiring waktu, keandalannya menurun pada pekerjaan skala repo, sehingga diperlukan workflow terpisah untuk mengawasi model
- Beberapa agen untuk memeriksa regresi pada file yang berdekatan
- Agen “senior reviewer” yang menempel pada tiap commit penting
- Verifikasi berkelanjutan untuk memeriksa drift implementasi dan implementasi yang belum selesai
- Pipeline lint/test untuk menangkap pekerjaan yang dengan percaya diri dinyatakan model sudah selesai
- Pada era 4.7, masalahnya membesar dalam workflow pribadi
- Model berhalusinasi bahwa sebuah fitur sudah selesai padahal implementasi nyatanya hanya sekitar 40%
- Menunjukkan kepercayaan diri tanpa dasar di sekitar stub/placeholder
- Muncul perilaku menghindar seperti berkata “perlu sesi terpisah” atau memperkirakan jadwal yang berlebihan untuk perubahan yang sebenarnya realistis dilakukan
- Meski membayar biaya Max x20, yang lebih terasa daripada peningkatan produktivitas adalah kenaikan konsumsi token dan beban supervisi
- Akhirnya pada 12 Mei beralih ke GPT-5.5 + Codex, dan coding dengan AI untuk pertama kalinya dalam beberapa bulan terasa lebih dekat ke kenyamanan daripada stres
Kelebihan yang terasa di GPT-5.5 + Codex
- Codex dapat memahami kode yang berdekatan dengan baik bahkan tanpa prompt berlebihan, dan lebih baik dalam menangkap regresi
- Loop umpan balik lint/test bekerja lebih ketat, dan refactor skala besar pun benar-benar menjadi bisa dikelola
- Keputusan infrastruktur dan perubahan arsitektur terasa mengarah ke arah yang konsisten alih-alih terpecah-pecah, dan model lebih dekat ke benar-benar menuntaskan pekerjaan daripada sekadar berpura-pura selesai
/fastkebanyakan dihindari karena tampaknya akan cepat menghabiskan kuota mingguan, tetapi hanya dengan high/xhigh pun peningkatan produktivitasnya besar- Memasukkan zip seluruh repositori ke GPT-5.5 Pro extended thinking membantu menyelesaikan masalah yang berulang kali gagal dipecahkan model lain
- Migrasinya juga hampir tanpa gesekan besar
- Ini bukan berarti semua orang harus segera pindah, tetapi untuk workflow ini, setidaknya untuk sementara waktu tidak ada niat untuk kembali
9 komentar
Pada suatu titik, codex tampaknya jauh lebih unggul dalam banyak hal.
Apa cuma saya yang jadi bolak-balik langganan? wkwkwk Juaranya terus ganti ya wkwkwkwk
Tapi ini adalah postingan dari subreddit codex, jadi perlu dibaca dengan sedikit mempertimbangkan konteks itu. Di Reddit, tingkat sikap terlalu memuja(?) bisa sangat berbeda tergantung subredditnya.
Dulu saat memakai Cursor, saya sering bergantian menggunakan beberapa model, tetapi sejak GPT-5, model OpenAI terasa relatif sangat hati-hati sekaligus rajin.
Saya juga merasa
codexpunya jatah token yang lebih longgar dan cukup bagus dalam menemukan kekurangan pada rencana atau kode yang dibuat Claude, jadi saya sampai bayar tambahan dengan niat untuk benar-benar pindah.Saya masih memegang keyakinan ini, tetapi saya juga belum bisa sepenuhnya meninggalkan Claude. Karena sekarang saya memakai
codexsebagai yang utama, kini justru Claude yang menemukan kekurangan dalam rencana atau kode daricodex.Saya selama ini terus menjadikan Codex sebagai yang utama, dan belakangan rasanya makin pintar.
Baru saja saya mengalaminya: sekarang sepertinya dia juga makin jago mengotomatiskan sendiri. Setelah saya menyesuaikan beberapa pengaturan terkait CDN, dia otomatis memasang timer yang akan berjalan 4320 menit kemudian, sambil bilang akan memeriksanya lagi 3 hari setelahnya.
Aplikasi Codex untuk Mac sangat nyaman dipakai. Sekarang versi mobile-nya juga sudah bagus, jadi sepertinya saya akan bekerja lebih banyak lagi
Claude tadinya di takhta, tapi setelah Codex 5.5 datang, rasanya Codex naik ke puncak.
Saya pakai keduanya, tapi belakangan ini hampir tidak pernah memakai Claude code. Sepertinya Codex lebih bagus, dan yang paling menentukan, token-nya memang nyaris tidak pernah habis.
Bulan depan apakah giliran Gemini, yang sampai sekarang masih belum pernah merebut takhta?
"Menghalusinasi bahwa implementasi nyata yang selesai sekitar 40% sudah tuntas, atau menunjukkan rasa percaya diri berlebihan di sekitar stub/placeholder"
Bagian soal halusinasi terhadap tingkat penyelesaian yang sebenarnya benar-benar bikin kesal dan sangat relate
Pendapat Hacker News
Tool AI bukan sesuatu yang perlu didukung cuma satu pihak seperti memilih tim olahraga favorit. Pelajari keduanya, kalau bisa semuanya, lalu pakai yang paling cocok minggu ini
Bulan depan bisa saja berbeda. Saya berlangganan dua layanan, tapi saya juga paham tidak semua orang bisa melakukannya
Semua tool itu oke, sebagian orang mendapat hasil lebih baik dari salah satunya, dan seperti yang dibilang, minggu depan pun bisa berubah total
Tapi saya juga pakai Gemini karena menemukan kupon premium 18 bulan seharga 15€ di Kinguin, jadi kalau kena batas kuota, sebagian pekerjaan saya alihkan ke Gemini
Opus 4.7 terasa berfokus pada terlihat berguna dan produktif, serta performa yang sifatnya untuk pamer
Codex benar-benar menyelesaikan pekerjaan
Akan bagus kalau kamu bisa sedikit berbagi alur kerjamu. Saya ingin belajar apa yang kamu lakukan dan bagaimana melakukannya supaya bisa saya tiru
Saya juga penasaran kenapa seluruh repositori dimasukkan ke GPT, serta teknologi dan buku apa yang dipakai
Saya biasanya memasukkan prompt, menunggu Codex selesai, lalu menanyakan lagi apakah ia sudah mengerjakan tugas-tugas sekitar yang jelas, yang dulu saya kerjakan sendiri. Setelah itu barulah dikerjakan, lalu saya habiskan waktu untuk
/reviewdan pengujian manual, kemudian lanjut lagi ke unit pekerjaan kecil. Untuk fitur besar saya pakai plan, juga memakai ekstensi VSCode, dan saya sudah mencoba 5.4 maupun 5.5, tapi yang pertama tampaknya lebih cocok buat sayaBagaimana cara memakai model selain OpenAI di sini?
Masalah Claude adalah ia tidak terus berjalan seperti Codex. Claude mungkin lebih bagus, tapi Codex berusaha menyelesaikan pekerjaan sampai tuntas
Claude begitu saja berhenti, dan bahkan kalau memang punya kemampuan itu pun rasanya akan terlalu mahal sehingga tidak banyak bedanya. Mungkin mirip atau malah lebih baik, tapi sekarang saya sudah tidak tahu dan tidak memakainya lagi. 4.5 adalah yang terbaik saat pertama keluar
Saya juga merasa Codex seperti sihir, tapi tunggu saja sampai rusak. Sampai 3 hari lalu saya juga merasa begitu, tapi sekarang sejujurnya rasanya malah lebih buruk daripada Claude
Saya memakainya 24 jam dengan 5 akun Pro, jadi saya bisa bilang dengan yakin, ini bukan seperti seminggu lalu dan sekarang benar-benar jauh lebih buruk