GPT‑5.3 Instant: Percakapan sehari-hari yang lebih alami dan berguna

(openai.com)

2 poin oleh GN⁺ 2026-03-04 | 1 komentar | Bagikan ke WhatsApp

Model yang paling banyak digunakan di ChatGPT telah diperbarui, meningkatkan akurasi, kelancaran, dan pemahaman konteks dalam percakapan sehari-hari
Versi baru mengurangi penolakan dan peringatan yang tidak perlu, serta memberikan jawaban yang langsung dan praktis untuk pertanyaan
Saat melakukan pencarian web, kemampuan mengintegrasikan informasi ditingkatkan sehingga menghasilkan respons yang dikontekstualisasikan, bukan sekadar ringkasan
Nada dan gaya percakapan menjadi lebih alami dan ringkas, sementara akurasi fakta dan kualitas penulisan kreatif juga diperkuat
GPT‑5.3 Instant langsung tersedia di ChatGPT dan API, sementara dukungan untuk GPT‑5.2 Instant dijadwalkan berakhir pada 3 Juni 2026

Ringkasan GPT‑5.3 Instant

Pembaruan ini meningkatkan kualitas percakapan sehari-hari di ChatGPT secara keseluruhan, dengan fokus pada jawaban akurat, pemahaman konteks, dan menjaga alur percakapan
- Mengurangi pemutusan yang tidak perlu, frasa peringatan yang berlebihan, dan ekspresi deklaratif untuk meningkatkan kealamian percakapan
Dengan mencerminkan masukan pengguna, pembaruan ini meningkatkan nada, relevansi, dan alur percakapan
Pembaruan ini dirancang berfokus pada pengalaman penggunaan sehari-hari, dengan penekanan pada peningkatan kualitas yang terasa nyata dibanding angka benchmark

Mengurangi penolakan yang tidak perlu dan memberi respons lebih ringkas

Versi sebelumnya (GPT‑5.2 Instant) memiliki masalah berupa penolakan berlebihan bahkan untuk pertanyaan yang aman dijawab, atau jawaban yang tertunda karena pembukaan bernada moral
GPT‑5.3 Instant mengurangi penolakan yang tidak perlu dan memberikan jawaban langsung yang berfokus pada pertanyaan
- Contoh: saat diminta menghitung panahan jarak jauh, GPT‑5.2 menambahkan pengantar panjang berisi peringatan keamanan, sedangkan
  GPT‑5.3 langsung meminta variabel fisika yang diperlukan (daya busur, massa anak panah, kecepatan, dan sebagainya) lalu melanjutkan perhitungan
Hasilnya, terjadi lebih sedikit pemutusan percakapan, dan respons yang cepat serta praktis menjadi memungkinkan

Peningkatan kualitas respons berbasis pencarian web

GPT‑5.3 Instant mengintegrasikan informasi dari web dengan pengetahuan internal dan kemampuan penalarannya untuk menghasilkan jawaban yang dikontekstualisasikan
- Alih-alih sekadar menampilkan tautan atau informasi berulang, model ini memprioritaskan ringkasan inti dan keterkaitan makna
Contoh: untuk pertanyaan “kontrak terbesar offseason MLB 2025–26”
- GPT‑5.2 menjelaskan contoh retrospektif dari musim sebelumnya, sedangkan
- GPT‑5.3 secara tepat menunjuk kontrak 4 tahun senilai 240 juta dolar AS milik Kyle Tucker dengan LA Dodgers,
  lalu menjelaskan kaitannya dengan perubahan struktur liga dan dampak negosiasi tenaga kerja
Hasilnya, kemutakhiran, relevansi, dan akurasi konteks meningkat

Gaya percakapan yang lebih alami

Sebagian respons GPT‑5.2 Instant mendapat umpan balik sebagai “tidak alami” karena ungkapan penghiburan yang berlebihan atau perkiraan emosi
GPT‑5.3 Instant diperbaiki dengan mengurangi ekspresi emosional yang tidak perlu dan memakai gaya percakapan alami yang fokus pada inti
- Contoh: untuk pertanyaan “mengapa sulit menemukan cinta di San Francisco”,
  GPT‑5.3 menjelaskan secara sistematis faktor struktural seperti budaya kota, mobilitas, dan jarak emosional
- Tanpa pembukaan seperti “Anda baik-baik saja”, model ini memberi respons analitis yang langsung dan mudah dipahami secara empatik

Peningkatan akurasi fakta

GPT‑5.3 Instant secara signifikan mengurangi tingkat halusinasi di bidang berisiko tinggi seperti medis, hukum, dan keuangan
- Saat menggunakan web, tingkat halusinasi turun 26,8%, dan saat hanya memakai pengetahuan internal turun 19,7%
- Dalam evaluasi berbasis umpan balik pengguna, juga terjadi penurunan 22,5% (saat memakai web) dan 9,6% (tanpa web)
Keandalan respons berbasis fakta meningkat, sehingga kegunaan praktisnya makin kuat

Peningkatan kemampuan menulis

GPT‑5.3 Instant menunjukkan peningkatan pada kedalaman naratif dan daya ungkap emosi, sehingga unggul dalam penulisan kreatif dan deskripsi sastra
- Contoh: saat diminta menulis puisi “pengantaran terakhir seorang tukang pos Philadelphia yang akan pensiun”,
  GPT‑5.3 menyampaikan emosi secara alami melalui adegan yang konkret dan detail sensorik
- Dibanding narasi sentimental GPT‑5.2, versi ini memiliki kelengkapan struktur dan kesan realistis yang lebih tinggi

Batasan dan perbaikan ke depan

Pada bahasa non-Inggris (seperti Jepang dan Korea), masih muncul ungkapan yang canggung atau terasa seperti terjemahan literal
- Peningkatan nada yang alami untuk tiap bahasa menjadi tugas berikutnya
Fitur penyesuaian nada respons masih terus disempurnakan, sambil terus mengumpulkan umpan balik pengguna

Ketersediaan dan rencana transisi

GPT‑5.3 Instant langsung tersedia untuk semua pengguna ChatGPT dan di API (gpt‑5.3‑chat‑latest)
Pembaruan untuk model Thinking dan Pro akan segera menyusul
Dukungan GPT‑5.2 Instant berakhir pada 3 Juni 2026, dan untuk pengguna berbayar akan tersedia selama 3 bulan sebagai ‘Legacy Models’

1 komentar

GN⁺ 2026-03-04

Komentar Hacker News

Masalah terbesar ChatGPT saat ini adalah gaya bahasanya yang canggung
Terlalu banyak frasa seperti “Why it matters”, “the big picture”, penekanan yang berlebihan, dan pertanyaan retoris
Versi awal GPT‑5 sebenarnya lumayan, tapi setelah katanya dibuat punya “kepribadian yang lebih hangat”, malah rusak lagi seperti 4o
Bahasa Jepang yang dulu juga bagus sekarang kualitasnya menurun, jadi mengecewakan
- Dulu saya juga menulis dengan gaya seperti “Why X works, but Y doesn’t”, tapi sekarang rasanya malah terlihat seperti manusia yang meniru LLM, jadi makin memalukan
  Jadi sekarang saya bahkan mencoba gaya menulis baru dengan menambahkan efek suara seperti <i>swoosh</i>
- Saya juga terganggu dengan gaya berulang itu, tapi sekarang saya sudah melampauinya dan hanya menyaring isinya saja
  Saya memakai output LLM sebagai referensi, tapi tidak menyalinnya mentah-mentah; saya tulis ulang dengan suara saya sendiri agar gaya pribadi tetap terjaga
- Mungkin sebentar lagi mereka akan merilis “versi premium yang tidak pongah”. Kalau begitu, cukup banyak orang mungkin akan pindah
Branding “5.2‑Instant” membingungkan
Saya kira itu model supercepat, ternyata lebih seperti versi 5.2 tanpa router
Rasanya OpenAI kembali ke situasi sebelum GPT‑5, saat modelnya terlalu banyak sampai orang bingung harus pakai yang mana
- ChatGPT Plus sebenarnya memakai dua keluarga model
  Satu adalah seri Instant yang cepat dan dioptimalkan untuk ChatGPT, tapi akurasinya lebih rendah
  Yang lain adalah seri Thinking yang lebih lambat tapi lebih cocok untuk pekerjaan profesional
  Mereka ingin menyederhanakan ke satu opsi saja, tetapi karena preferensi pengguna berbeda-beda, kedua model itu tetap disediakan (penulis komentar ini adalah karyawan OpenAI)
- Orang suka punya pilihan, jadi pemisahan dengan “5.2 Instant / 5.2 Thinking” lebih jelas daripada sekadar “5.2”
  Pesaing seperti Gemini 3 Fast / Gemini 3 Thinking juga memakai pendekatan yang sama
- Masih ada sekitar 800 ribu orang per hari yang memakai gpt‑4o, jadi ada tujuan untuk mempertahankan basis pengguna itu
  Model “Thinking” mahal biayanya, jadi strateginya adalah menahan mereka dengan model Instant yang murah
- Kita tetap harus melihat benchmark nyata, tetapi menurut penjelasan OpenAI, Instant adalah model yang dioptimalkan untuk latensi
  Untuk antarmuka suara, waktu sampai token pertama lebih penting daripada kecepatan token per detik
Saya tertawa melihat judul “GPT‑5.3 Instant: Smoother, more …”
Akhir-akhir ini bahasa promosi LLM terdengar seperti iklan rokok
- “GPT‑5.3 Instant: It’s toasted…”
- “LLMenthols”
- “GPT Super Mild”
- “GPT Crush”
Di halaman itu ada frasa “Better judgment around refusals”,
jadi saya penasaran apakah perusahaan AI pernah secara resmi membahas masalah penerapan aturan yang berbeda untuk tiap kelompok
Misalnya menolak lelucon tentang kelompok tertentu tetapi membolehkan untuk kelompok lain
Lalu makalah ini juga menyatakan bahwa model menilai nilai nyawa manusia secara berbeda berdasarkan negara
- Bukankah itu bisa saja cerminan norma sosial?
- Bagi saya masalah terbesarnya adalah bias yang berpusat pada AS
  Bahkan ketika saya meminta jawaban dalam satuan metric, model sering tidak mematuhinya, jadi saya harus mengulang pertanyaan memasak beberapa kali
  Sekarang sudah agak membaik, tetapi sudut pandang Amerika masih terasa kuat
- Kritik soal bias model itu valid, tetapi makalah tersebut tampak lemah secara metodologi
  Mereka menghitung “kurs” nyawa manusia berdasarkan harga kambing, padahal itu bisa saja hanya mencerminkan perbedaan biaya hidup antarnegara
  Sampelnya juga hanya 11 negara, jadi sulit digeneralisasi
- Dalam makalah ACM, disebutkan bahwa eksperimen “kurs” seperti ini hanyalah hasil dari desain evaluasi
  dan tidak menunjukkan preferensi intrinsik model yang sebenarnya
  Jika diberi opsi netral, kebanyakan model menilai semua nyawa manusia setara
  Selain itu, makalah aslinya juga kurang terbuka soal data, dan sulit menghubungkan kode dengan hasil, sehingga kredibilitasnya rendah
Menurut tautan perbandingan,
Gemini 3.1 Lite (no reasoning) berkinerja lebih baik daripada GPT‑5.3 (no reasoning)
- Dan biayanya juga jauh lebih murah: GPT‑5.3 sekitar $0.256, sedangkan Gemini sekitar $0.011
Saya merasa tidak nyaman karena contoh di pengumuman itu menyebut perhitungan lintasan artileri jarak jauh
- Memang tidak nyaman, tapi juga tidak aneh
  OpenAI sedang bekerja sama dengan militer AS, jadi tampaknya mereka mencoba menormalisasi penggunaan militer seperti ini
  Rasanya seperti strategi untuk membungkusnya dengan contoh yang makin sehari-hari agar penolakan orang jadi tumpul
- Saya melihat contoh itu sebagai penghormatan pada masa awal komputer digunakan untuk menghitung balistik
  Tetapi melihat situasi sekarang, saya tidak yakin tafsir itu benar
- Bisa juga itu cuma contoh yang terasa seperti berasal dari buku fisika SMA
- Mengingat kejadian-kejadian baru-baru ini, contoh seperti itu terlihat seperti kekeliruan yang tidak peka
- Ada juga yang bercanda menanggapinya dengan, “Memangnya baru-baru ini ada kecelakaan panahan?”
Saya setuju dengan penjelasan bahwa “GPT‑5.3 Instant lebih baik dalam menggabungkan informasi yang diambil dari web”
Dalam praktiknya, GPT memang jauh lebih alami dalam memanfaatkan pencarian dibanding Claude
- Sebaliknya, saya justru merasa Claude terlalu sering melakukan pencarian
  Selain itu ada bug yang membuatnya lupa pengaturan meski pencarian web sudah dimatikan
Dalam benchmark saya, GPT‑5.3 menunjukkan performa setara atau sedikit lebih rendah daripada 5.2‑chat
Jadi saya rasa saya paham mengapa mereka tidak mempublikasikan benchmark di blog
Tautan perbandingan
Hal yang menarik, tepat sebelum pengumuman “5.3 Instant”, mereka malah menghapus opsi “Instant” dari pemilih model
lalu menggantinya dengan “Auto (tetapi Auto-switch dimatikan)”
Penjelasan “otomatis, tetapi otomatisnya dimatikan” terasa seperti bukti bahwa mereka sendiri juga bingung

GPT‑5.3 Instant: Percakapan sehari-hari yang lebih alami dan berguna

Ringkasan GPT‑5.3 Instant

Mengurangi penolakan yang tidak perlu dan memberi respons lebih ringkas

Peningkatan kualitas respons berbasis pencarian web

Gaya percakapan yang lebih alami

Peningkatan akurasi fakta

Peningkatan kemampuan menulis

Batasan dan perbaikan ke depan

Ketersediaan dan rencana transisi

Bacaan terkait

1 komentar

Komentar Hacker News