2 poin oleh GN⁺ 2026-03-04 | 1 komentar | Bagikan ke WhatsApp
  • Model yang paling banyak digunakan di ChatGPT telah diperbarui, meningkatkan akurasi, kelancaran, dan pemahaman konteks dalam percakapan sehari-hari
  • Versi baru mengurangi penolakan dan peringatan yang tidak perlu, serta memberikan jawaban yang langsung dan praktis untuk pertanyaan
  • Saat melakukan pencarian web, kemampuan mengintegrasikan informasi ditingkatkan sehingga menghasilkan respons yang dikontekstualisasikan, bukan sekadar ringkasan
  • Nada dan gaya percakapan menjadi lebih alami dan ringkas, sementara akurasi fakta dan kualitas penulisan kreatif juga diperkuat
  • GPT‑5.3 Instant langsung tersedia di ChatGPT dan API, sementara dukungan untuk GPT‑5.2 Instant dijadwalkan berakhir pada 3 Juni 2026

Ringkasan GPT‑5.3 Instant

  • Pembaruan ini meningkatkan kualitas percakapan sehari-hari di ChatGPT secara keseluruhan, dengan fokus pada jawaban akurat, pemahaman konteks, dan menjaga alur percakapan
    • Mengurangi pemutusan yang tidak perlu, frasa peringatan yang berlebihan, dan ekspresi deklaratif untuk meningkatkan kealamian percakapan
  • Dengan mencerminkan masukan pengguna, pembaruan ini meningkatkan nada, relevansi, dan alur percakapan
  • Pembaruan ini dirancang berfokus pada pengalaman penggunaan sehari-hari, dengan penekanan pada peningkatan kualitas yang terasa nyata dibanding angka benchmark

Mengurangi penolakan yang tidak perlu dan memberi respons lebih ringkas

  • Versi sebelumnya (GPT‑5.2 Instant) memiliki masalah berupa penolakan berlebihan bahkan untuk pertanyaan yang aman dijawab, atau jawaban yang tertunda karena pembukaan bernada moral
  • GPT‑5.3 Instant mengurangi penolakan yang tidak perlu dan memberikan jawaban langsung yang berfokus pada pertanyaan
    • Contoh: saat diminta menghitung panahan jarak jauh, GPT‑5.2 menambahkan pengantar panjang berisi peringatan keamanan, sedangkan
      GPT‑5.3 langsung meminta variabel fisika yang diperlukan (daya busur, massa anak panah, kecepatan, dan sebagainya) lalu melanjutkan perhitungan
  • Hasilnya, terjadi lebih sedikit pemutusan percakapan, dan respons yang cepat serta praktis menjadi memungkinkan

Peningkatan kualitas respons berbasis pencarian web

  • GPT‑5.3 Instant mengintegrasikan informasi dari web dengan pengetahuan internal dan kemampuan penalarannya untuk menghasilkan jawaban yang dikontekstualisasikan
    • Alih-alih sekadar menampilkan tautan atau informasi berulang, model ini memprioritaskan ringkasan inti dan keterkaitan makna
  • Contoh: untuk pertanyaan “kontrak terbesar offseason MLB 2025–26”
    • GPT‑5.2 menjelaskan contoh retrospektif dari musim sebelumnya, sedangkan
    • GPT‑5.3 secara tepat menunjuk kontrak 4 tahun senilai 240 juta dolar AS milik Kyle Tucker dengan LA Dodgers,
      lalu menjelaskan kaitannya dengan perubahan struktur liga dan dampak negosiasi tenaga kerja
  • Hasilnya, kemutakhiran, relevansi, dan akurasi konteks meningkat

Gaya percakapan yang lebih alami

  • Sebagian respons GPT‑5.2 Instant mendapat umpan balik sebagai “tidak alami” karena ungkapan penghiburan yang berlebihan atau perkiraan emosi
  • GPT‑5.3 Instant diperbaiki dengan mengurangi ekspresi emosional yang tidak perlu dan memakai gaya percakapan alami yang fokus pada inti
    • Contoh: untuk pertanyaan “mengapa sulit menemukan cinta di San Francisco”,
      GPT‑5.3 menjelaskan secara sistematis faktor struktural seperti budaya kota, mobilitas, dan jarak emosional
    • Tanpa pembukaan seperti “Anda baik-baik saja”, model ini memberi respons analitis yang langsung dan mudah dipahami secara empatik

Peningkatan akurasi fakta

  • GPT‑5.3 Instant secara signifikan mengurangi tingkat halusinasi di bidang berisiko tinggi seperti medis, hukum, dan keuangan
    • Saat menggunakan web, tingkat halusinasi turun 26,8%, dan saat hanya memakai pengetahuan internal turun 19,7%
    • Dalam evaluasi berbasis umpan balik pengguna, juga terjadi penurunan 22,5% (saat memakai web) dan 9,6% (tanpa web)
  • Keandalan respons berbasis fakta meningkat, sehingga kegunaan praktisnya makin kuat

Peningkatan kemampuan menulis

  • GPT‑5.3 Instant menunjukkan peningkatan pada kedalaman naratif dan daya ungkap emosi, sehingga unggul dalam penulisan kreatif dan deskripsi sastra
    • Contoh: saat diminta menulis puisi “pengantaran terakhir seorang tukang pos Philadelphia yang akan pensiun”,
      GPT‑5.3 menyampaikan emosi secara alami melalui adegan yang konkret dan detail sensorik
    • Dibanding narasi sentimental GPT‑5.2, versi ini memiliki kelengkapan struktur dan kesan realistis yang lebih tinggi

Batasan dan perbaikan ke depan

  • Pada bahasa non-Inggris (seperti Jepang dan Korea), masih muncul ungkapan yang canggung atau terasa seperti terjemahan literal
    • Peningkatan nada yang alami untuk tiap bahasa menjadi tugas berikutnya
  • Fitur penyesuaian nada respons masih terus disempurnakan, sambil terus mengumpulkan umpan balik pengguna

Ketersediaan dan rencana transisi

  • GPT‑5.3 Instant langsung tersedia untuk semua pengguna ChatGPT dan di API (gpt‑5.3‑chat‑latest)
  • Pembaruan untuk model Thinking dan Pro akan segera menyusul
  • Dukungan GPT‑5.2 Instant berakhir pada 3 Juni 2026, dan untuk pengguna berbayar akan tersedia selama 3 bulan sebagai ‘Legacy Models’

1 komentar

 
GN⁺ 2026-03-04
Komentar Hacker News
  • Masalah terbesar ChatGPT saat ini adalah gaya bahasanya yang canggung
    Terlalu banyak frasa seperti “Why it matters”, “the big picture”, penekanan yang berlebihan, dan pertanyaan retoris
    Versi awal GPT‑5 sebenarnya lumayan, tapi setelah katanya dibuat punya “kepribadian yang lebih hangat”, malah rusak lagi seperti 4o
    Bahasa Jepang yang dulu juga bagus sekarang kualitasnya menurun, jadi mengecewakan

    • Dulu saya juga menulis dengan gaya seperti “Why X works, but Y doesn’t”, tapi sekarang rasanya malah terlihat seperti manusia yang meniru LLM, jadi makin memalukan
      Jadi sekarang saya bahkan mencoba gaya menulis baru dengan menambahkan efek suara seperti <i>swoosh</i>
    • Saya juga terganggu dengan gaya berulang itu, tapi sekarang saya sudah melampauinya dan hanya menyaring isinya saja
      Saya memakai output LLM sebagai referensi, tapi tidak menyalinnya mentah-mentah; saya tulis ulang dengan suara saya sendiri agar gaya pribadi tetap terjaga
    • Mungkin sebentar lagi mereka akan merilis “versi premium yang tidak pongah”. Kalau begitu, cukup banyak orang mungkin akan pindah
  • Branding “5.2‑Instant” membingungkan
    Saya kira itu model supercepat, ternyata lebih seperti versi 5.2 tanpa router
    Rasanya OpenAI kembali ke situasi sebelum GPT‑5, saat modelnya terlalu banyak sampai orang bingung harus pakai yang mana

    • ChatGPT Plus sebenarnya memakai dua keluarga model
      Satu adalah seri Instant yang cepat dan dioptimalkan untuk ChatGPT, tapi akurasinya lebih rendah
      Yang lain adalah seri Thinking yang lebih lambat tapi lebih cocok untuk pekerjaan profesional
      Mereka ingin menyederhanakan ke satu opsi saja, tetapi karena preferensi pengguna berbeda-beda, kedua model itu tetap disediakan (penulis komentar ini adalah karyawan OpenAI)
    • Orang suka punya pilihan, jadi pemisahan dengan “5.2 Instant / 5.2 Thinking” lebih jelas daripada sekadar “5.2”
      Pesaing seperti Gemini 3 Fast / Gemini 3 Thinking juga memakai pendekatan yang sama
    • Masih ada sekitar 800 ribu orang per hari yang memakai gpt‑4o, jadi ada tujuan untuk mempertahankan basis pengguna itu
      Model “Thinking” mahal biayanya, jadi strateginya adalah menahan mereka dengan model Instant yang murah
    • Kita tetap harus melihat benchmark nyata, tetapi menurut penjelasan OpenAI, Instant adalah model yang dioptimalkan untuk latensi
      Untuk antarmuka suara, waktu sampai token pertama lebih penting daripada kecepatan token per detik
  • Saya tertawa melihat judul “GPT‑5.3 Instant: Smoother, more …”
    Akhir-akhir ini bahasa promosi LLM terdengar seperti iklan rokok

    • “GPT‑5.3 Instant: It’s toasted…”
    • “LLMenthols”
    • “GPT Super Mild”
    • “GPT Crush”
  • Di halaman itu ada frasa “Better judgment around refusals”,
    jadi saya penasaran apakah perusahaan AI pernah secara resmi membahas masalah penerapan aturan yang berbeda untuk tiap kelompok
    Misalnya menolak lelucon tentang kelompok tertentu tetapi membolehkan untuk kelompok lain
    Lalu makalah ini juga menyatakan bahwa model menilai nilai nyawa manusia secara berbeda berdasarkan negara

    • Bukankah itu bisa saja cerminan norma sosial?
    • Bagi saya masalah terbesarnya adalah bias yang berpusat pada AS
      Bahkan ketika saya meminta jawaban dalam satuan metric, model sering tidak mematuhinya, jadi saya harus mengulang pertanyaan memasak beberapa kali
      Sekarang sudah agak membaik, tetapi sudut pandang Amerika masih terasa kuat
    • Kritik soal bias model itu valid, tetapi makalah tersebut tampak lemah secara metodologi
      Mereka menghitung “kurs” nyawa manusia berdasarkan harga kambing, padahal itu bisa saja hanya mencerminkan perbedaan biaya hidup antarnegara
      Sampelnya juga hanya 11 negara, jadi sulit digeneralisasi
    • Dalam makalah ACM, disebutkan bahwa eksperimen “kurs” seperti ini hanyalah hasil dari desain evaluasi
      dan tidak menunjukkan preferensi intrinsik model yang sebenarnya
      Jika diberi opsi netral, kebanyakan model menilai semua nyawa manusia setara
      Selain itu, makalah aslinya juga kurang terbuka soal data, dan sulit menghubungkan kode dengan hasil, sehingga kredibilitasnya rendah
  • Menurut tautan perbandingan,
    Gemini 3.1 Lite (no reasoning) berkinerja lebih baik daripada GPT‑5.3 (no reasoning)

    • Dan biayanya juga jauh lebih murah: GPT‑5.3 sekitar $0.256, sedangkan Gemini sekitar $0.011
  • Saya merasa tidak nyaman karena contoh di pengumuman itu menyebut perhitungan lintasan artileri jarak jauh

    • Memang tidak nyaman, tapi juga tidak aneh
      OpenAI sedang bekerja sama dengan militer AS, jadi tampaknya mereka mencoba menormalisasi penggunaan militer seperti ini
      Rasanya seperti strategi untuk membungkusnya dengan contoh yang makin sehari-hari agar penolakan orang jadi tumpul
    • Saya melihat contoh itu sebagai penghormatan pada masa awal komputer digunakan untuk menghitung balistik
      Tetapi melihat situasi sekarang, saya tidak yakin tafsir itu benar
    • Bisa juga itu cuma contoh yang terasa seperti berasal dari buku fisika SMA
    • Mengingat kejadian-kejadian baru-baru ini, contoh seperti itu terlihat seperti kekeliruan yang tidak peka
    • Ada juga yang bercanda menanggapinya dengan, “Memangnya baru-baru ini ada kecelakaan panahan?”
  • Saya setuju dengan penjelasan bahwa “GPT‑5.3 Instant lebih baik dalam menggabungkan informasi yang diambil dari web”
    Dalam praktiknya, GPT memang jauh lebih alami dalam memanfaatkan pencarian dibanding Claude

    • Sebaliknya, saya justru merasa Claude terlalu sering melakukan pencarian
      Selain itu ada bug yang membuatnya lupa pengaturan meski pencarian web sudah dimatikan
  • Dalam benchmark saya, GPT‑5.3 menunjukkan performa setara atau sedikit lebih rendah daripada 5.2‑chat
    Jadi saya rasa saya paham mengapa mereka tidak mempublikasikan benchmark di blog
    Tautan perbandingan

  • Hal yang menarik, tepat sebelum pengumuman “5.3 Instant”, mereka malah menghapus opsi “Instant” dari pemilih model
    lalu menggantinya dengan “Auto (tetapi Auto-switch dimatikan)”
    Penjelasan “otomatis, tetapi otomatisnya dimatikan” terasa seperti bukti bahwa mereka sendiri juga bingung