- Model yang paling banyak digunakan di ChatGPT telah diperbarui, meningkatkan akurasi, kelancaran, dan pemahaman konteks dalam percakapan sehari-hari
- Versi baru mengurangi penolakan dan peringatan yang tidak perlu, serta memberikan jawaban yang langsung dan praktis untuk pertanyaan
- Saat melakukan pencarian web, kemampuan mengintegrasikan informasi ditingkatkan sehingga menghasilkan respons yang dikontekstualisasikan, bukan sekadar ringkasan
- Nada dan gaya percakapan menjadi lebih alami dan ringkas, sementara akurasi fakta dan kualitas penulisan kreatif juga diperkuat
- GPT‑5.3 Instant langsung tersedia di ChatGPT dan API, sementara dukungan untuk GPT‑5.2 Instant dijadwalkan berakhir pada 3 Juni 2026
Ringkasan GPT‑5.3 Instant
- Pembaruan ini meningkatkan kualitas percakapan sehari-hari di ChatGPT secara keseluruhan, dengan fokus pada jawaban akurat, pemahaman konteks, dan menjaga alur percakapan
- Mengurangi pemutusan yang tidak perlu, frasa peringatan yang berlebihan, dan ekspresi deklaratif untuk meningkatkan kealamian percakapan
- Dengan mencerminkan masukan pengguna, pembaruan ini meningkatkan nada, relevansi, dan alur percakapan
- Pembaruan ini dirancang berfokus pada pengalaman penggunaan sehari-hari, dengan penekanan pada peningkatan kualitas yang terasa nyata dibanding angka benchmark
Mengurangi penolakan yang tidak perlu dan memberi respons lebih ringkas
- Versi sebelumnya (GPT‑5.2 Instant) memiliki masalah berupa penolakan berlebihan bahkan untuk pertanyaan yang aman dijawab, atau jawaban yang tertunda karena pembukaan bernada moral
- GPT‑5.3 Instant mengurangi penolakan yang tidak perlu dan memberikan jawaban langsung yang berfokus pada pertanyaan
- Contoh: saat diminta menghitung panahan jarak jauh, GPT‑5.2 menambahkan pengantar panjang berisi peringatan keamanan, sedangkan
GPT‑5.3 langsung meminta variabel fisika yang diperlukan (daya busur, massa anak panah, kecepatan, dan sebagainya) lalu melanjutkan perhitungan
- Hasilnya, terjadi lebih sedikit pemutusan percakapan, dan respons yang cepat serta praktis menjadi memungkinkan
Peningkatan kualitas respons berbasis pencarian web
- GPT‑5.3 Instant mengintegrasikan informasi dari web dengan pengetahuan internal dan kemampuan penalarannya untuk menghasilkan jawaban yang dikontekstualisasikan
- Alih-alih sekadar menampilkan tautan atau informasi berulang, model ini memprioritaskan ringkasan inti dan keterkaitan makna
- Contoh: untuk pertanyaan “kontrak terbesar offseason MLB 2025–26”
- GPT‑5.2 menjelaskan contoh retrospektif dari musim sebelumnya, sedangkan
- GPT‑5.3 secara tepat menunjuk kontrak 4 tahun senilai 240 juta dolar AS milik Kyle Tucker dengan LA Dodgers,
lalu menjelaskan kaitannya dengan perubahan struktur liga dan dampak negosiasi tenaga kerja
- Hasilnya, kemutakhiran, relevansi, dan akurasi konteks meningkat
Gaya percakapan yang lebih alami
- Sebagian respons GPT‑5.2 Instant mendapat umpan balik sebagai “tidak alami” karena ungkapan penghiburan yang berlebihan atau perkiraan emosi
- GPT‑5.3 Instant diperbaiki dengan mengurangi ekspresi emosional yang tidak perlu dan memakai gaya percakapan alami yang fokus pada inti
- Contoh: untuk pertanyaan “mengapa sulit menemukan cinta di San Francisco”,
GPT‑5.3 menjelaskan secara sistematis faktor struktural seperti budaya kota, mobilitas, dan jarak emosional
- Tanpa pembukaan seperti “Anda baik-baik saja”, model ini memberi respons analitis yang langsung dan mudah dipahami secara empatik
Peningkatan akurasi fakta
- GPT‑5.3 Instant secara signifikan mengurangi tingkat halusinasi di bidang berisiko tinggi seperti medis, hukum, dan keuangan
- Saat menggunakan web, tingkat halusinasi turun 26,8%, dan saat hanya memakai pengetahuan internal turun 19,7%
- Dalam evaluasi berbasis umpan balik pengguna, juga terjadi penurunan 22,5% (saat memakai web) dan 9,6% (tanpa web)
- Keandalan respons berbasis fakta meningkat, sehingga kegunaan praktisnya makin kuat
Peningkatan kemampuan menulis
- GPT‑5.3 Instant menunjukkan peningkatan pada kedalaman naratif dan daya ungkap emosi, sehingga unggul dalam penulisan kreatif dan deskripsi sastra
- Contoh: saat diminta menulis puisi “pengantaran terakhir seorang tukang pos Philadelphia yang akan pensiun”,
GPT‑5.3 menyampaikan emosi secara alami melalui adegan yang konkret dan detail sensorik
- Dibanding narasi sentimental GPT‑5.2, versi ini memiliki kelengkapan struktur dan kesan realistis yang lebih tinggi
Batasan dan perbaikan ke depan
- Pada bahasa non-Inggris (seperti Jepang dan Korea), masih muncul ungkapan yang canggung atau terasa seperti terjemahan literal
- Peningkatan nada yang alami untuk tiap bahasa menjadi tugas berikutnya
- Fitur penyesuaian nada respons masih terus disempurnakan, sambil terus mengumpulkan umpan balik pengguna
Ketersediaan dan rencana transisi
- GPT‑5.3 Instant langsung tersedia untuk semua pengguna ChatGPT dan di API (
gpt‑5.3‑chat‑latest)
- Pembaruan untuk model Thinking dan Pro akan segera menyusul
- Dukungan GPT‑5.2 Instant berakhir pada 3 Juni 2026, dan untuk pengguna berbayar akan tersedia selama 3 bulan sebagai ‘Legacy Models’
1 komentar
Komentar Hacker News
Masalah terbesar ChatGPT saat ini adalah gaya bahasanya yang canggung
Terlalu banyak frasa seperti “Why it matters”, “the big picture”, penekanan yang berlebihan, dan pertanyaan retoris
Versi awal GPT‑5 sebenarnya lumayan, tapi setelah katanya dibuat punya “kepribadian yang lebih hangat”, malah rusak lagi seperti 4o
Bahasa Jepang yang dulu juga bagus sekarang kualitasnya menurun, jadi mengecewakan
Jadi sekarang saya bahkan mencoba gaya menulis baru dengan menambahkan efek suara seperti <i>swoosh</i>
Saya memakai output LLM sebagai referensi, tapi tidak menyalinnya mentah-mentah; saya tulis ulang dengan suara saya sendiri agar gaya pribadi tetap terjaga
Branding “5.2‑Instant” membingungkan
Saya kira itu model supercepat, ternyata lebih seperti versi 5.2 tanpa router
Rasanya OpenAI kembali ke situasi sebelum GPT‑5, saat modelnya terlalu banyak sampai orang bingung harus pakai yang mana
Satu adalah seri Instant yang cepat dan dioptimalkan untuk ChatGPT, tapi akurasinya lebih rendah
Yang lain adalah seri Thinking yang lebih lambat tapi lebih cocok untuk pekerjaan profesional
Mereka ingin menyederhanakan ke satu opsi saja, tetapi karena preferensi pengguna berbeda-beda, kedua model itu tetap disediakan (penulis komentar ini adalah karyawan OpenAI)
Pesaing seperti Gemini 3 Fast / Gemini 3 Thinking juga memakai pendekatan yang sama
Model “Thinking” mahal biayanya, jadi strateginya adalah menahan mereka dengan model Instant yang murah
Untuk antarmuka suara, waktu sampai token pertama lebih penting daripada kecepatan token per detik
Saya tertawa melihat judul “GPT‑5.3 Instant: Smoother, more …”
Akhir-akhir ini bahasa promosi LLM terdengar seperti iklan rokok
Di halaman itu ada frasa “Better judgment around refusals”,
jadi saya penasaran apakah perusahaan AI pernah secara resmi membahas masalah penerapan aturan yang berbeda untuk tiap kelompok
Misalnya menolak lelucon tentang kelompok tertentu tetapi membolehkan untuk kelompok lain
Lalu makalah ini juga menyatakan bahwa model menilai nilai nyawa manusia secara berbeda berdasarkan negara
Bahkan ketika saya meminta jawaban dalam satuan metric, model sering tidak mematuhinya, jadi saya harus mengulang pertanyaan memasak beberapa kali
Sekarang sudah agak membaik, tetapi sudut pandang Amerika masih terasa kuat
Mereka menghitung “kurs” nyawa manusia berdasarkan harga kambing, padahal itu bisa saja hanya mencerminkan perbedaan biaya hidup antarnegara
Sampelnya juga hanya 11 negara, jadi sulit digeneralisasi
dan tidak menunjukkan preferensi intrinsik model yang sebenarnya
Jika diberi opsi netral, kebanyakan model menilai semua nyawa manusia setara
Selain itu, makalah aslinya juga kurang terbuka soal data, dan sulit menghubungkan kode dengan hasil, sehingga kredibilitasnya rendah
Menurut tautan perbandingan,
Gemini 3.1 Lite (no reasoning) berkinerja lebih baik daripada GPT‑5.3 (no reasoning)
Saya merasa tidak nyaman karena contoh di pengumuman itu menyebut perhitungan lintasan artileri jarak jauh
OpenAI sedang bekerja sama dengan militer AS, jadi tampaknya mereka mencoba menormalisasi penggunaan militer seperti ini
Rasanya seperti strategi untuk membungkusnya dengan contoh yang makin sehari-hari agar penolakan orang jadi tumpul
Tetapi melihat situasi sekarang, saya tidak yakin tafsir itu benar
Saya setuju dengan penjelasan bahwa “GPT‑5.3 Instant lebih baik dalam menggabungkan informasi yang diambil dari web”
Dalam praktiknya, GPT memang jauh lebih alami dalam memanfaatkan pencarian dibanding Claude
Selain itu ada bug yang membuatnya lupa pengaturan meski pencarian web sudah dimatikan
Dalam benchmark saya, GPT‑5.3 menunjukkan performa setara atau sedikit lebih rendah daripada 5.2‑chat
Jadi saya rasa saya paham mengapa mereka tidak mempublikasikan benchmark di blog
Tautan perbandingan
Hal yang menarik, tepat sebelum pengumuman “5.3 Instant”, mereka malah menghapus opsi “Instant” dari pemilih model
lalu menggantinya dengan “Auto (tetapi Auto-switch dimatikan)”
Penjelasan “otomatis, tetapi otomatisnya dimatikan” terasa seperti bukti bahwa mereka sendiri juga bingung