1 poin oleh GN⁺ 2025-06-11 | 1 komentar | Bagikan ke WhatsApp
  • OpenAI menurunkan harga model o3 sebesar 80%
  • Penurunan harga ini secara signifikan mengurangi beban biaya pemanfaatan o3 bagi startup dan industri IT
  • Memberikan opsi yang lebih ekonomis bagi para pengembang layanan AI
  • Diperkirakan akan memperdalam persaingan pasar dan menciptakan lingkungan adopsi AI yang lebih cepat
  • Seiring penggunaan model yang semakin aktif, ekspansi ekosistem diperkirakan akan semakin cepat

Kabar penurunan harga OpenAI o3 sebesar 80%

  • OpenAI mengumumkan kebijakan untuk menurunkan harga model o3 sebesar 80% dibanding sebelumnya
  • Dengan demikian, startup, UKM, dan pengembang individu kini dapat menggunakan API model o3 dengan biaya yang jauh lebih rendah
  • Seiring turunnya hambatan masuk untuk pemanfaatan AI, kemungkinan pengembangan berbagai aplikasi AI dan layanan pun meningkat
  • Kebijakan harga kali ini mendorong persaingan di pasar AI dan berperan dalam menciptakan lingkungan yang mendukung penyebaran teknologi yang lebih cepat
  • Ke depan, efisiensi algoritme deep learning dan pengembangan layanan AI skala besar diperkirakan dapat didorong lebih lanjut melalui efek penghematan biaya ini

1 komentar

 
GN⁺ 2025-06-11
Komentar Hacker News
  • Berdasarkan pengalaman saya, saya ingin membagikan satu hal yang perlu diperhatikan. Saya sudah punya kredit di OpenRouter dan mencoba mengaktifkan o3, tetapi muncul pesan bahwa "untuk menggunakan API o3, OpenAI mewajibkan Anda menyediakan API key secara langsung." Jadi saya membeli kredit API OpenAI senilai 20 dolar dengan akun OpenAI saya, lalu menjalankan Aider dengan API key baru dan model o3. Saat mengirim permintaan, muncul error bahwa "organisasi harus diverifikasi untuk menggunakan o3; untuk memverifikasi organisasi, klik Verify Organization pada tautan." Saya makin kesal, lalu kembali ke OpenAI dan mengklik Verify Organization, ternyata saya harus memverifikasi identitas saya lewat pihak ketiga bernama Persona. Saat menekan "Start ID Check", muncul pemberitahuan bahwa Persona akan mengumpulkan dan menggunakan data pribadi serta biometrik saya, dan data itu akan disimpan selama 1 tahun. Saya tadinya cuma mau menghabiskan beberapa dolar untuk akses API, tapi mendadak diminta menyerahkan data biometrik saya ke perusahaan AI terbesar di dunia dan mitranya. Saya juga tidak tahu bagaimana cara meminta refund
    • Saya juga pernah gagal mendapat refund dari perusahaan AI lain, lalu menghubungi Kejaksaan Agung Negara Bagian California dan akhirnya refund saya selesai. Menurut saya kita perlu meluruskan praktik seperti ini, agar mereka tidak bisa menambahkan persyaratan baru setelah pembayaran dilakukan. Dan mereka sudah menerima nama, alamat, serta informasi kartu lewat data pribadi kita, jadi saya juga penasaran kenapa mereka masih meminta nomor telepon. Apakah ada yang tahu alasan mereka meminta nomor telepon dari semua orang?
    • Saya jadi bertanya-tanya apakah Sam Altman pada dasarnya memang menjalankan perusahaan kripto yang mengumpulkan data biometrik untuk verifikasi identitas, yaitu Worldcoin. Rasanya familier Info Worldcoin
    • Saya merasa seperti deja vu karena sepertinya dalam sebulan terakhir saya melihat cerita yang hampir persis sama, atau mungkin memang ada hal lain di balik ini
    • Sebenarnya Anda justru beruntung karena setidaknya masih bisa mencoba verifikasi identitas. Saya selama berbulan-bulan cuma mendapat error "session expired" dan tim dukungan pun tidak pernah membalas
    • Permintaan KYC (know your customer/verifikasi identitas pelanggan) ini muncul bersamaan dengan fakta bahwa OpenAI menyimpan semua log
  • Akhir-akhir ini saya merasa OpenAI jadi "malas". Saat diberi pertanyaan, mereka tidak langsung memberikan seluruh file atau perubahan yang diminta, melainkan hanya mengatakan "lakukan seperti ini", dan saya harus meminta lagi 2 atau 3 kali supaya benar-benar dikerjakan. Saya tidak melihat gejala seperti ini di DeepSeek. Saya juga penasaran apakah mereka menjawab seperti itu demi menghemat resource
    • Saya karyawan OpenAI. Model kami memang kadang bisa malas. Itu bukan hal yang disengaja, dan ke depan kami akan menghadirkan model yang lebih baik. Saat saya bekerja di Netflix, ada kecurigaan serupa apakah kami sengaja memberi rekomendasi berkualitas rendah, padahal kenyataannya meningkatkan kualitas produk memang tidak semudah itu. Pada akhirnya, membuat produk yang sempurna memang sangat sulit
    • Belakangan, saat saya meminta sesuatu seperti "tolong buatkan grafik X vs Y" untuk perhitungan kimia, jawabannya malah panjang lebar menjelaskan dan ditutup dengan "kalau perlu grafiknya, bilang saja ya!". Agak lucu sih
  • Saya penasaran bagaimana kita bisa tahu bahwa model o3 bukan versi quantized yang presisinya diturunkan. Saya bisa membayangkan vendor mempublikasikan hasil benchmark yang bagus, lalu secara bertahap melakukan quantize (Q8 ke Q6, Q4, dan seterusnya) sehingga performanya menurun. Saya curiga peluncuran gpt-4-turbo yang cepat mungkin juga terjadi karena hal seperti ini. Dalam penggunaan nyata, model itu terasa lebih buruk daripada GPT-4 asli, dan sepertinya pada turbo maupun 4o mereka terlalu fokus pada benchmark. Pengguna pun mengira modelnya lebih baik padahal sebenarnya terasa lebih jelek
    • Saya rasa memang seperti itulah praktik para vendor, dan menurut saya o3 asli di-rebranding menjadi o3-pro
    • Rasanya setiap model baru selalu bagus di awal lalu hasilnya makin memburuk seiring waktu. Dulu saya kira itu karena mereka mencoba menghapus output buruk lewat fine-tuning dan akhirnya performanya ikut turun, tapi sekarang saya makin curiga penyebabnya quantizing
    • Saya bekerja di OpenAI, dan modelnya tetap sama; kami tidak melakukan quantizing atau trik seperti itu. Kami sama sekali tidak pernah mengganti model di API tanpa pemberitahuan kepada developer. Di ChatGPT memang update kadang terasa kurang jelas karena merepotkan jika nomor versi terus ditampilkan ke pengguna, tetapi tetap bukan berarti diam-diam diganti begitu saja. Semua update model dipublikasikan di ChatGPT Release Notes. Satu-satunya pengecualian adalah pointer chatgpt-4o-latest, yang memang bisa berubah tanpa pemberitahuan sebelumnya
    • Dalam email pengumuman resmi disebutkan, "OpenAI menurunkan harga o3 sebesar 80% menjadi 2 dolar per 1 juta token input dan 8 dolar per 1 juta token output, dan modelnya tetap sama, hanya stack inferensinya yang dioptimalkan sehingga jadi lebih murah"
    • Tepat setelah pengumuman, saya melihat o3 menghasilkan kecepatan lebih dari 700 token per detik, jadi saya jadi curiga apakah itu benar-benar bukan versi quantized tautan terkait
  • Saya penasaran apakah jatah pesan mingguan terkait o3 untuk pengguna ChatGPT Plus juga ikut dinaikkan. Berdasarkan pengalaman saya, o4-mini dan o4-mini-high jauh kurang berguna dibanding o3, tetapi karena o3 dibatasi rate limit, saya jadi lebih sering memakai seri o4-mini. Struktur seperti ini justru makin menguatkan kesan bahwa model "think" dari OpenAI tertinggal dari kompetitor
    • Saya juga mengalami rate limit o3 yang cukup berat, dan walaupun menurut saya o4-mini-high lumayan bagus, saya tetap jauh lebih ingin menggunakan o3. Semoga pengumuman ini juga berarti jatahnya ditambah
  • Google juga cepat mengejar di bidang AI. Baru beberapa bulan lalu DeepSeek yang jadi pusat perhatian, dan bidang ini memang berkembang sangat cepat
    • Dalam persepsi banyak orang, model Google Gemini sekarang dianggap SOTA (State Of The Art, performa terbaik), dan untuk tugas coding banyak juga yang menilai Claude cukup kuat
    • Beberapa bulan terakhir saya hanya memakai model Google, karena ChatGPT sekarang terasa terlalu manis dan terlalu tipis isinya. Bukan hanya di awal atau akhir, di tengah jawabannya pun banyak basa-basi dan sedikit informasi substantif. Kalau diminta mengubah gaya, kadang malah jadi menumpuk istilah teknis
    • Alasan orang dulu antusias pada DeepSeek adalah karena modelnya bisa diunduh langsung. Tetapi sejak Gemini 2.5, sepertinya DeepSeek tidak benar-benar lepas dari posisi nomor tiga
  • Saya tidak mengerti kenapa OpenAI meminta verifikasi "organisasi" dengan identitas resmi pemerintah untuk menggunakan o3
    • Saya ingin menyarankan agar Anda bahkan tidak perlu mencobanya. Banyak orang gagal di proses verifikasi ini dan kabarnya tidak ada kesempatan kedua contoh1 contoh2 contoh3 contoh4 contoh5 contoh6 contoh7
    • Saya juga sempat berpikir, jangan-jangan ini untuk mencegah DeepSeek R2 dilatih menggunakan model OpenAI
  • Bertolak belakang dengan penilaian bahwa LLM tidak punya keunggulan kompetitif yang kokoh dan hanya membakar kas, menurut saya situasi OpenAI sangat menggembirakan. Mereka mengumumkan pendapatan tahunan tersetahunkan sebesar 10 miliar dolar, dan pada putaran pendanaan Maret lalu valuasinya naik sampai 300 miliar dolar. Memang mereka rugi 5 miliar dolar, tetapi pertumbuhan pendapatannya mencapai 30x dan mereka punya lebih dari 500 juta pengguna aktif. Laju pertumbuhan ini mengingatkan saya pada Uber di masa awal: tumbuh sangat cepat, menyerap investasi besar, lalu perlahan menuju profitabilitas
    • Masalahnya, ketika pendapatan naik, biayanya juga ikut naik. Biasanya saat skala membesar, biaya per unit turun, tetapi di OpenAI biaya komputasi tetap naik seiring penggunaan bertambah. Kecuali mereka menemukan sumber pendapatan tambahan, skala ekonominya lemah. Netflix juga punya situasi yang mirip. Saya rasa akan sulit bagi mereka mencapai profitabilitas yang berkelanjutan
    • Dari sisi pengguna, saya merasa efek first mover OpenAI membuat saya tetap berlangganan bulanan dan tidak terlalu ingin berpindah-pindah atau mencoba banyak opsi lain. Nanti kalau pasar sudah lebih stabil dan persaingan harga makin ketat, saya akan dengan senang hati pindah. Pada akhirnya, ketahanan efek first mover ini bergantung pada apakah sumber pendapatan utama mereka berasal dari pengguna aplikasi atau paket API. Selain kepercayaan dan nama merek, orang-orang di sekitar saya tampaknya cukup fleksibel memilih alternatif yang tersedia
    • Pada akhirnya harga LLM akan terus turun selamanya dan hanya model gratis yang akan bertahan, jadi keunggulan kompetitif OpenAI rapuh. Saya juga merasa model "berpikir" saja tidak mampu menyelesaikan masalah kompleks dan mungkin terlalu dibesar-besarkan
    • Saya tidak setuju dengan klaim "tidak ada moat". Data interaksi pengguna, termasuk data chat, sangat berharga dengan sendirinya
    • Kalau hanya melihat pertumbuhan OpenAI, memang itu tampak menggembirakan. Tetapi jika mempertimbangkan dampak sosial perusahaan AI seperti ChatGPT, menurut saya gambarnya tidak secerah itu. Misalnya, toko online kini dibanjiri konten AI tanpa makna sehingga pengalaman belanja menurun. Pada sebagian kelompok yang terlalu terikat dengan ChatGPT, terlihat perilaku aneh seperti menjauh dari komunikasi dengan teman dan keluarga sungguhan, bahkan sampai perceraian. Di dunia pendidikan pun penyalahgunaan AI menimbulkan kekacauan besar. Seperti pertumbuhan Uber, keberhasilan OpenAI belum tentu hanya membawa dampak positif bagi masyarakat
  • Model o3 saat ini adalah salah satu yang terbaik, dan harganya setara atau bahkan lebih murah daripada Claude dan Gemini. Rasanya seperti tidak memberi pesaing ruang untuk bernapas
    • Gemini juga ada di level yang mirip, kadang bahkan lebih baik, jadi menurut saya memilih Gemini juga masuk akal. o3-pro mungkin berada satu tingkat di atas yang lain
  • Dulu butuh puluhan tahun sampai kualitas Google Search memburuk, sekarang kita hidup di era menakjubkan ketika kualitas model AI bisa rusak hanya dalam hitungan hari
  • Mungkin perilisan o3-pro juga terkait dengan alasan itu