2 poin oleh GN⁺ 2025-12-03 | 3 komentar | Bagikan ke WhatsApp
  • OpenAI beralih secara darurat ke tahap ‘kode merah’ untuk meningkatkan kualitas ChatGPT, dalam upaya memulihkan keunggulan yang goyah akibat kejaran Google
  • Saat ini perbaikan fitur inti seperti personalisasi, kecepatan, keandalan, dan perluasan cakupan pertanyaan dinilai mendesak, sehingga semua proyek baru seperti iklan, Pulse, agen kesehatan, dan agen belanja dihentikan atau ditunda
  • Gemini 3 dari Google baru-baru ini melampaui model OpenAI di banyak benchmark, dan keberhasilan model gambar Nano Banana membuat MAU melonjak dari 450 juta → 650 juta, yang muncul sebagai ancaman utama
  • OpenAI juga menghadapi tekanan finansial yang makin besar, seperti komitmen investasi pusat data senilai ratusan miliar dolar dan kebutuhan pendapatan tahunan 200 miliar dolar hingga 2030, sementara pertumbuhan pelanggan enterprise Anthropic juga menjadi faktor persaingan
  • OpenAI mengoperasikan sistem pengecekan harian dan melakukan realokasi tim, sambil secara internal menyatakan bahwa model reasoning baru yang akan segera dirilis lebih unggul daripada versi terbaru Gemini, menjadikan pemulihan kepemimpinan sebagai titik penentu penting

Aktivasi kode merah dan rencana peningkatan ChatGPT

  • Melalui memo internal, terungkap bahwa OpenAI telah mengaktifkan ‘kode merah’, mode darurat tingkat tertinggi, untuk mengatasi masalah ChatGPT
    • OpenAI menggunakan sistem peringatan tiga tahap yellow → orange → red, dan langkah kali ini merupakan kenaikan satu tingkat dari kode oranye
  • Cakupan perbaikannya meliputi penguatan personalisasi, peningkatan kecepatan respons, perbaikan keandalan server, dan perluasan jenis pertanyaan yang bisa dijawab, yang mencakup keseluruhan pengalaman pengguna
  • Untuk itu, semua proyek baru seperti iklan, Pulse (asisten pribadi), serta agen kesehatan dan belanja didorong ke prioritas belakang
    • Perusahaan juga mendorong realokasi tenaga kerja lintas organisasi dan memutuskan untuk menjalankan panggilan khusus harian (daily call) guna memeriksa perkembangan pengembangan setiap hari
  • Belakangan muncul keluhan terhadap GPT-5 seperti nada yang dingin dan kesalahan pada pertanyaan dasar, sehingga penyesuaian ulang terhadap nada model dan kemampuan mengikuti instruksi juga termasuk dalam langkah ini

Kejaran Google Gemini dan tekanan persaingan

  • Model Gemini 3 terbaru dari Google melampaui OpenAI di berbagai benchmark industri, menunjukkan bahwa peta persaingan telah terguncang besar
    • Tak lama setelah pengumuman Gemini, saham Google naik dan performanya mendapat sorotan kuat di pasar
    Iklan
  • Sejak model pembuat gambar Nano Banana dirilis pada Agustus, MAU seluruh layanan Google AI
    • ditunjukkan melonjak dari 450 juta pada Juli → 650 juta pada Oktober
  • Anthropic juga memperluas basis pelanggan enterprise, sehingga terlihat tren bahwa keunggulan dominasi tunggal OpenAI melemah
  • Situasi ini digambarkan ironis karena ‘kode merah’ yang dulu diumumkan Google segera setelah kemunculan ChatGPT kini berbalik ke pihak OpenAI

Investasi, tekanan finansial, dan kegelisahan pasar

  • Melalui kontrak dengan Microsoft dan Amazon, OpenAI menandatangani kontrak listrik pusat data sebesar 36GW, sehingga
    • ke depan dapat timbul biaya sewa pusat data tahunan sekitar 620 miliar dolar
  • Juga disajikan proyeksi internal bahwa untuk berbalik untung pada 2030, OpenAI memerlukan pendapatan sekitar 200 miliar dolar per tahun
  • OpenAI memang tidak memiliki rencana IPO, tetapi
    • struktur keuangan ini sangat terkait dengan harga saham perusahaan teknologi utama seperti Nvidia, Oracle, dan Microsoft, sehingga berdampak pada pasar secara keseluruhan
    Iklan
  • OpenAI masih merugi dan dinilai memiliki struktur di mana sulit bertahan tanpa penggalangan dana besar yang berkelanjutan

Pratinjau peluncuran model baru dan kepercayaan diri internal

  • Dalam memo tersebut, Altman menyebut bahwa model reasoning baru yang akan dirilis minggu depan lebih unggul daripada versi terbaru Google Gemini
    • Ini tampak sebagai unsur untuk mengangkat moral internal sekaligus menegaskan pertumbuhan ChatGPT dan tekad memulihkan kepemimpinan
  • ChatGPT masih memiliki basis pengguna yang kuat, yakni lebih dari 800 juta pengguna mingguan, dan
    • OpenAI berencana mempertahankan tren pertumbuhan dengan kembali menambahkan peningkatan pada kecepatan, akurasi, dan personalisasi

Konteks keseluruhan

  • Di tengah kombinasi persaingan yang makin ketat (Google dan Anthropic), kontroversi kualitas produk, dan biaya infrastruktur berskala besar,
    memulihkan kualitas dasar ChatGPT muncul sebagai strategi bertahan OpenAI sekaligus prioritas paling mendesak

3 komentar

 
slowandsnow 2025-12-04

Masalah pada ChatGPT
Terlalu banyak bug. Sudah menekan kirim tetapi pesan tidak dibuat, atau saat streaming pesan muncul error lalu semuanya hilang, dan sebagainya. Deep Research memiliki sumber yang lebih sedikit dibanding mode penalaran. Jadi tidak ada lagi alasan untuk menggunakan Deep Research.
Masalah pada Codex
Terlalu lambat. Pekerjaan yang bisa selesai dalam 5 menit di Claude Code memakan waktu lebih dari 10 menit di Codex. Terlalu bodoh.

 
yinn27 2025-12-04

Tapi bukankah Gemini dari sisi UI dan secara keseluruhan lebih tidak nyaman digunakan dibanding ChatGPT..?

 
GN⁺ 2025-12-03
Komentar Hacker News
  • Minggu lalu, seorang pelanggan mengirim pertanyaan tentang fitur yang sebagian saya tulis. Engineer support membuat jawaban lewat Claude, dan meskipun sudah dilatih dengan dokumen internal maupun publik, ia dengan sangat percaya diri menghasilkan omong kosong yang terdengar meyakinkan
    Saat saya sedang menjelaskan kenapa itu salah, engineer lain mencoba lewat Augment, dan kali ini ia lagi-lagi mengeluarkan omong kosong lain dengan penuh keyakinan. Akhirnya kami cuma saling kirim emoji menangis, dan saya akan tetap memakai kecerdasan saya sendiri ke depannya

    • Kode saya butuh 0,11 detik, kode Gemini butuh 0,5 detik. Atasan bertanya kenapa, dan saya tidak tahu harus menjelaskannya bagaimana ¯\(ツ)
    • LLM memang sangat lemah untuk hal-hal yang mustahil dilakukan. Kadang malah lebih baik benar-benar mengimplementasikan fitur yang mereka halusinasikan. Beberapa penyedia API publik sudah melakukan itu
  • Saya mendengar rumor bahwa OpenAI tidak berhasil melakukan pre-training yang sukses sejak pertengahan 2024. Kalau menanyakan peristiwa terkini ke ChatGPT 5.1 tanpa internet, katanya cutoff pengetahuannya ada di Juni 2024. Saya tidak tahu apakah itu karena model kecil, tetapi kalau pada titik sekarang tertinggal 18 bulan, itu terasa seperti sinyal yang mengkhawatirkan

    • Hal yang sama juga muncul di newsletter SemiAnalysis, dan belum pernah dibantah
    • Kadang saat mencoba coding dengan model GPT, gaya percakapannya yang ringkas memang terlihat bagus selama beberapa hari. Tapi pada akhirnya kualitasnya kalah dari Claude atau Gemini, dan pola gagalnya juga lebih banyak
    • Saya pernah bertanya ke ChatGPT 5.1 soal masalah instalasi codex CLI, dan ia dengan yakin mengatakan codex sudah dihentikan dan saya salah memakai perintah ‘openai’
    • Google juga pernah mengalami masalah keterlambatan web crawling di awal 2000-an dan tetap bertahan. Bedanya, OpenAI sekarang tidak punya posisi yang terdiferensiasi seperti Google saat itu, jadi situasinya bisa jauh lebih berbahaya
    • Saya bertanya apakah sebaiknya memainkan Indiana Jones di PS5 atau PC, awalnya ia mengira itu salah ketik, lalu akhirnya mencari di internet dan memuji lig gaming saya
  • Rasanya dampak dari keluarnya para peneliti inti OpenAI yang berlangsung sejak tahun lalu kini mulai benar-benar terasa. Sam Altman adalah sales, bukan peneliti. Ilya juga sudah tidak ada, dan orang-orang kunci pindah ke Google, Meta, Anthropic, atau mendirikan perusahaan sendiri. Orang yang tersisa mungkin kuat dalam perbaikan iteratif, tapi apakah mereka bisa memimpin lompatan berikutnya sendiri masih meragukan

  • OpenAI sekarang terasa seperti Netscape. Inovatif, tapi tidak punya model pendapatan yang berkelanjutan. Di satu sisi, perusahaan seperti Google membundel AI gratis ke produk yang sudah ada, sementara di sisi lain Deepseek dan Qwen menekan harga lewat open source. Jadi pada akhirnya mereka terjepit dari dua arah

    • Katanya OpenAI tahun ini akan melewati pendapatan tahunan 20 miliar dolar (artikel CNBC)
    • Kalau OpenAI gagal mengomersialkan bisnisnya dan kembali ke model nirlaba untuk membagikan alat gratis, itu berarti menempuh jalan Mozilla
    • Katanya “Google akan membundel Gemini secara gratis”, tapi bukankah mereka sebenarnya sudah melakukannya di hampir semua produk?
    • Istri saya menolak pindah ke Claude. Ia merasa ChatGPT sudah dituning sempurna sesuai seleranya
    • Untuk membundel Gemini gratis, biaya inferensi Flash 3.0 harus dibuat jauh lebih rendah daripada 2.5
  • Ada satu hal yang benar-benar membuat saya penasaran. Bagaimana mungkin OpenAI gagal di pre-training? Mereka sudah pernah berhasil, talenta mereka kelas atas, jadi bukankah tinggal melatih ulang model 2024 saja?

    • Alasannya sama seperti kenapa semua orang gagal. Hyperparameter disetel ulang agar cocok dengan hardware baru, perbaikan dari paper diterapkan, lalu setelah berbulan-bulan dan jutaan dolar, loss menjadi datar dan hasilnya minim
    • Kalau yang dimaksud ‘sukses’ adalah performa yang jelas lebih baik daripada model sebelumnya, itu memang sangat sulit
    • Saya dengar GPT-4.5 adalah percobaan semacam itu. Hanya saja performanya tidak cukup bagus sehingga tidak dirilis
    • Model baru tidak melanjutkan pelatihan model lama. Karena arsitekturnya benar-benar berbeda. Kali ini sangat mungkin desainnya keliru sehingga hasilnya malah lebih buruk daripada model pertengahan 2024
  • Code Red” yang pernah saya alami biasanya hanya istilah untuk membungkus keadaan ketika seluruh perusahaan kehilangan arah. Manajemen menengah tidak tahu harus melakukan apa, dan akhirnya beban dilempar ke engineer

    • Memecat PM dan manajer menengah tidak otomatis mencegah keadaan seperti ini. Itu pandangan yang terlalu menyederhanakan struktur pengambilan keputusan di organisasi besar
    • Kalau benar-benar Code Red, perusahaan harus menyatukan prioritas dan memindahkan engineer ke proyek inti
    • Satu-satunya kasus yang pernah saya lihat memang sampai memecat PM, dan masalah-masalah tak terduga pun bermunculan, tapi itu diterima dengan sikap “bagus, sekarang kita jadi tahu masalahnya”
    • Ada juga khayalan engineer bahwa “semua masalah ini salah orang lain, kalau cuma saya yang tersisa semuanya akan beres”
    • Code Red kali ini juga bisa jadi alasan untuk menghentikan fitur monetisasi. Sebuah langkah untuk menghindari jurang antara valuasi dan kenyataan
  • Code Red yang sebenarnya bukan karena Google melampaui OpenAI, melainkan karena kini terlihat jelas bahwa industri AI tidak punya moat. Pada akhirnya semua pemain sedang bertarung dalam perlombaan ke dasar yang paling mahal

    • Perusahaan-perusahaan seperti ini pada akhirnya akan mensosialisasikan kerugian lewat kontrak pemerintah atau bailout tidak langsung
    • Masih belum jelas apakah performa Gemini 3 benar-benar membuat pengguna ChatGPT berpindah
    • Saya tidak mengerti kenapa investor begitu bersemangat pada kompetisi komoditisasi yang strukturnya merugi. Saya juga sempat jadi penggemar di era GPT3~4, tapi sekarang memakai Claude dan Gemini bersamaan. Loyalitas saya nol
    • Kalau begitu, kenapa saham Google melonjak tajam setelah rilis Gemini 2.5 Pro?
    • Saya juga dulu mengira OpenAI punya teknik training rahasia, ternyata tidak ada
  • OpenAI telah berkomitmen pada belanja jangka panjang sebesar 500 miliar dolar lewat proyek Stargate dan lain-lain. Mereka berencana menaruh 250 miliar dolar ke Microsoft Azure, serta miliaran dolar lagi ke GPU AMD. Oracle sampai mengambil obligasi 18 miliar dolar dan pinjaman 9,6 miliar dolar untuk ini
    Kalau OpenAI tertinggal, mereka mungkin tidak sanggup menanggung kontrak-kontrak ini, dan bisa muncul risiko gagal bayar berantai. Campur tangan pemerintah juga mungkin terjadi

    • Altman bilang tidak akan ada bailout, tapi ucapan itu sendiri adalah strategi untuk membangun kepercayaan
    • 500 miliar dolar itu adalah komitmen belanja, bukan pendapatan. Bedanya sangat besar
    • Saya justru berharap kebuntuan di Kongres menghalangi bailout seperti ini
    • Sebagian besar hanyalah LOI yang tidak mengikat, jadi komitmennya tidak sekuat kelihatannya
    • Dengan arsitektur LLM, mungkin mustahil mencapai AGI. Kalau tidak ada arsitektur pengganti, semua kontrak ini bisa jadi tidak berarti
  • Katanya OpenAI menunda proyek seperti iklan, belanja, agen kesehatan, dan Pulse untuk fokus memperbaiki ChatGPT, tapi secara mendasar orang-orang inti itu sedikit, dan sisanya bisa mengerjakan fitur iklan atau komersial. Keduanya tidak harus bentrok

    • Bottleneck-nya bukan tenaga kerja, melainkan kapasitas berpikir strategis dari kepemimpinan
    • Masalahnya mungkin bukan kualitas produk, tetapi kemampuan membangun ekosistem. Google sudah terintegrasi ke alat sehari-hari
    • Perkembangan LLM terbagi dua lapisan: ① arsitektur tingkat rendah ② sistem aplikasi dan verifikasi. Yang kedua berkontribusi pada perbaikan model inti lewat pembuatan data verifikasi otomatis
    • ‘Penundaan’ mungkin bukan penghentian total, melainkan realokasi sumber daya komputasi
    • Dari sudut pandang konsumen, semoga persaingan seperti ini berujung pada peningkatan kualitas model
  • Menurut WSJ, OpenAI sedang menunda iklan, AI untuk kesehatan dan belanja, serta asisten pribadi Pulse. Ditambah kolaborasi hardware dengan Jony Ive, semuanya terasa seperti fokus yang terpecah

    • Selain itu, mereka juga pernah mengumumkan proyek seperti jejaring sosial atau browser
    • Kalau ingin bersaing dengan Google, yang paling penting adalah masuk ke pasar iklan. Kalau tidak, anggaran iklan akan mengalir ke Meta, Amazon, dan Google
    • Pada akhirnya yang penting adalah iklan dan asisten ala Siri/Alexa, jadi aneh kalau itu justru ditunda
    • Ini bukan sekadar kehilangan fokus, melainkan kini telah menjadi perusahaan yang berorientasi pada hasil jangka pendek. Sulit mengalahkan lawan seperti Google yang sudah memainkan permainan itu selama 25 tahun. Ekspansi hardware saja ada batasnya
    • Sebenarnya ini bukan soal bersaing dengan Google, melainkan iklan adalah ujian hidup-mati OpenAI.
      Jika iklan menghasilkan uang, OpenAI bisa menjadi perusahaan sekelas Mag 7, tetapi jika gagal, realitasnya akan terlihat.
      Kalau ternyata hasil eksperimen iklan sudah di bawah harapan, maka ‘Code Red’ mungkin hanyalah sinyal untuk membeli waktu demi menutupinya.
      ChatGPT bukan titik masuk pencarian seperti Google, dan juga tidak memungkinkan iklan berbasis feed seperti Meta.
      Pada akhirnya besar kemungkinan hanya akan mengulangi kegagalan Alexa.