- Selama 3 bulan coding dengan Claude/Anthropic, tetapi keandalannya menurun pada pekerjaan skala repo sehingga diperlukan workflow pemantauan terpisah
- Pada era 4.7, model berhalusinasi mengaku pekerjaan sudah selesai padahal implementasi nyatanya hanya sekitar 40%, atau menunjukkan kepercayaan diri berlebihan di sekitar stub/placeholder
- Meski membayar biaya Max x20, yang terasa justru konsumsi token dan beban supervisi lebih besar daripada produktivitas
- Codex lebih baik memahami kode yang berdekatan tanpa prompt berlebihan, menangkap regresi, sehingga loop lint/test dan refactor skala besar menjadi bisa dikelola
- Migrasi praktis selesai hanya dengan memindahkan CLAUDE.md→AGENTS.md dan mempertahankan hooks, dan untuk workflow ini tidak ada niat untuk kembali
Alur pengembangan yang berubah setelah beralih dari Claude ke Codex
- Selama 3 bulan terakhir, penulis terutama coding dengan Claude/Anthropic, dan saat Opus 4.6 dirilis, keunggulannya terasa pada pemahaman arsitektur, penanganan konteks besar, dan implementasi fitur yang cepat
- Seiring waktu, keandalannya menurun pada pekerjaan skala repo, sehingga diperlukan workflow terpisah untuk mengawasi model
- Beberapa agen untuk memeriksa regresi pada file yang berdekatan
- Agen “senior reviewer” yang menempel pada tiap commit penting
- Verifikasi berkelanjutan untuk memeriksa drift implementasi dan implementasi yang belum selesai
- Pipeline lint/test untuk menangkap pekerjaan yang dengan percaya diri dinyatakan model sudah selesai
- Pada era 4.7, masalahnya membesar dalam workflow pribadi
- Model berhalusinasi bahwa sebuah fitur sudah selesai padahal implementasi nyatanya hanya sekitar 40%
- Menunjukkan kepercayaan diri tanpa dasar di sekitar stub/placeholder
- Muncul perilaku menghindar seperti berkata “perlu sesi terpisah” atau memperkirakan jadwal yang berlebihan untuk perubahan yang sebenarnya realistis dilakukan
- Meski membayar biaya Max x20, yang lebih terasa daripada peningkatan produktivitas adalah kenaikan konsumsi token dan beban supervisi
- Akhirnya pada 12 Mei beralih ke GPT-5.5 + Codex, dan coding dengan AI untuk pertama kalinya dalam beberapa bulan terasa lebih dekat ke kenyamanan daripada stres
Kelebihan yang terasa di GPT-5.5 + Codex
- Codex dapat memahami kode yang berdekatan dengan baik bahkan tanpa prompt berlebihan, dan lebih baik dalam menangkap regresi
- Loop umpan balik lint/test bekerja lebih ketat, dan refactor skala besar pun benar-benar menjadi bisa dikelola
- Keputusan infrastruktur dan perubahan arsitektur terasa mengarah ke arah yang konsisten alih-alih terpecah-pecah, dan model lebih dekat ke benar-benar menuntaskan pekerjaan daripada sekadar berpura-pura selesai
/fast kebanyakan dihindari karena tampaknya akan cepat menghabiskan kuota mingguan, tetapi hanya dengan high/xhigh pun peningkatan produktivitasnya besar
- Memasukkan zip seluruh repositori ke GPT-5.5 Pro extended thinking membantu menyelesaikan masalah yang berulang kali gagal dipecahkan model lain
- Migrasinya juga hampir tanpa gesekan besar
CLAUDE.md dipindahkan ke AGENTS.md
- hooks tetap berlanjut seperti semula
- Hampir tidak perlu mengubah keseluruhan workflow
- Ini bukan berarti semua orang harus segera pindah, tetapi untuk workflow ini, setidaknya untuk sementara waktu tidak ada niat untuk kembali
1 komentar
Pendapat Hacker News
Tool AI bukan sesuatu yang perlu didukung cuma satu pihak seperti memilih tim olahraga favorit. Pelajari keduanya, kalau bisa semuanya, lalu pakai yang paling cocok minggu ini
Bulan depan bisa saja berbeda. Saya berlangganan dua layanan, tapi saya juga paham tidak semua orang bisa melakukannya
Semua tool itu oke, sebagian orang mendapat hasil lebih baik dari salah satunya, dan seperti yang dibilang, minggu depan pun bisa berubah total
Tapi saya juga pakai Gemini karena menemukan kupon premium 18 bulan seharga 15€ di Kinguin, jadi kalau kena batas kuota, sebagian pekerjaan saya alihkan ke Gemini
Opus 4.7 terasa berfokus pada terlihat berguna dan produktif, serta performa yang sifatnya untuk pamer
Codex benar-benar menyelesaikan pekerjaan
Akan bagus kalau kamu bisa sedikit berbagi alur kerjamu. Saya ingin belajar apa yang kamu lakukan dan bagaimana melakukannya supaya bisa saya tiru
Saya juga penasaran kenapa seluruh repositori dimasukkan ke GPT, serta teknologi dan buku apa yang dipakai
Saya biasanya memasukkan prompt, menunggu Codex selesai, lalu menanyakan lagi apakah ia sudah mengerjakan tugas-tugas sekitar yang jelas, yang dulu saya kerjakan sendiri. Setelah itu barulah dikerjakan, lalu saya habiskan waktu untuk
/reviewdan pengujian manual, kemudian lanjut lagi ke unit pekerjaan kecil. Untuk fitur besar saya pakai plan, juga memakai ekstensi VSCode, dan saya sudah mencoba 5.4 maupun 5.5, tapi yang pertama tampaknya lebih cocok buat sayaBagaimana cara memakai model selain OpenAI di sini?
Masalah Claude adalah ia tidak terus berjalan seperti Codex. Claude mungkin lebih bagus, tapi Codex berusaha menyelesaikan pekerjaan sampai tuntas
Claude begitu saja berhenti, dan bahkan kalau memang punya kemampuan itu pun rasanya akan terlalu mahal sehingga tidak banyak bedanya. Mungkin mirip atau malah lebih baik, tapi sekarang saya sudah tidak tahu dan tidak memakainya lagi. 4.5 adalah yang terbaik saat pertama keluar
Saya juga merasa Codex seperti sihir, tapi tunggu saja sampai rusak. Sampai 3 hari lalu saya juga merasa begitu, tapi sekarang sejujurnya rasanya malah lebih buruk daripada Claude
Saya memakainya 24 jam dengan 5 akun Pro, jadi saya bisa bilang dengan yakin, ini bukan seperti seminggu lalu dan sekarang benar-benar jauh lebih buruk