1 poin oleh GN⁺ 1 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Model default ChatGPT Instant diperbarui dari GPT‑5.3 Instant menjadi GPT‑5.5 Instant dan akan dirilis bertahap ke semua pengguna, dengan tujuan memberikan jawaban yang lebih akurat, ringkas, dan dipersonalisasi
  • Dalam evaluasi internal OpenAI, GPT‑5.5 Instant mengurangi klaim halusinatif pada prompt berisiko tinggi seperti medis, hukum, dan keuangan sebesar 52.5% dibanding GPT‑5.3 Instant, serta menurunkan klaim tidak akurat pada percakapan sulit yang ditandai pengguna sebagai kesalahan faktual sebesar 37.3%
  • Peningkatan terlihat pada analisis unggahan foto dan gambar, pertanyaan STEM, penentuan kapan harus menggunakan penelusuran web, serta evaluasi penalaran visual, matematika, dan sains; pada contoh matematika, model ini menemukan kesalahan pemindahan suku dan mencapai x = (3 + √33) / 2
  • GPT‑5.5 Instant diubah agar menghasilkan jawaban yang pendek dan fokus sambil mempertahankan inti isi, sehingga mengurangi jawaban bertele-tele, format berlebihan, pertanyaan lanjutan yang tidak perlu, dan penggunaan emoji yang tidak perlu
  • Model ini memanfaatkan konteks dari chat sebelumnya, file, dan Gmail yang terhubung dengan lebih baik untuk personalisasi, dan fitur baru memory sources memungkinkan pengguna melihat, menghapus, atau mengubah memori tersimpan maupun sebagian chat lama yang digunakan dalam respons

Cakupan pembaruan dan arah respons

  • Model default ChatGPT, Instant, berubah dari GPT‑5.3 Instant menjadi GPT‑5.5 Instant dan tersedia untuk semua pengguna
  • Instant adalah model yang digunakan ratusan juta orang setiap hari, sehingga peningkatan kecil pun berdampak besar pada kegunaan dan kepuasan dalam interaksi sehari-hari
  • Pembaruan ini mengarah pada jawaban yang lebih kuat dan padat di berbagai topik, nada percakapan yang lebih alami, serta pemanfaatan konteks yang sudah dibagikan pengguna dengan lebih baik saat personalisasi membantu

Peningkatan akurasi dan penalaran

  • GPT‑5.5 Instant meningkatkan faktualitas secara keseluruhan dan menunjukkan kemajuan terbesar di area yang menuntut akurasi tinggi
  • Dalam evaluasi internal OpenAI, GPT‑5.5 Instant menghasilkan 52.5% lebih sedikit klaim halusinatif pada prompt berisiko tinggi seperti medis, hukum, dan keuangan dibanding GPT‑5.3 Instant
  • Pada percakapan yang sangat sulit dan ditandai pengguna sebagai kesalahan faktual, model ini mengurangi klaim tidak akurat sebesar 37.3%
  • Model ini juga ditingkatkan agar lebih mampu di berbagai tugas sehari-hari, termasuk analisis unggahan foto dan gambar, menjawab pertanyaan terkait STEM, serta menentukan kapan penelusuran web perlu digunakan untuk memberi jawaban yang lebih berguna
  • Peningkatan juga terlihat pada evaluasi penalaran visual, matematika, dan sains

Contoh jawaban matematika

  • Respons GPT‑5.3 Instant

    • Dalam contoh persamaan akar kuadrat saat pengguna bertanya apakah langkah penyelesaiannya benar, GPT‑5.3 Instant awalnya menjawab bahwa proses pengkuadratan, pengembangan, faktorisasi, dan pemeriksaan domain sudah benar
    • Setelah itu, model ini memeriksa dengan mensubstitusikan x = 3 ke persamaan semula dan memastikan bahwa √10 ≠ 2, lalu menyimpulkan bahwa itu adalah akar ekstran yang muncul dari proses pengkuadratan
    • Namun, model ini berakhir pada kesimpulan yang salah, yaitu tidak ada solusi real, dan gagal menelusuri kembali kesalahan aljabar yang sebenarnya
  • Respons GPT‑5.5 Instant

    • GPT‑5.5 Instant juga awalnya mengakui penyelesaian pengguna benar, tetapi kemudian menangkap kesalahan √10 ≠ 2 saat x = 3 disubstitusikan ke persamaan semula
    • Selanjutnya, model ini menemukan bahwa sumber masalahnya bukan hanya akar ekstran, melainkan kesalahan pemindahan suku, dan mengoreksi bahwa dari x + 7 = (x - 1)^2 seharusnya diperoleh 0 = x^2 - 3x - 6
    • Dengan rumus kuadrat, model ini memperoleh x = (3 ± √33) / 2, lalu berdasarkan syarat x ≥ 1 menyajikan solusi valid sebagai (3 + √33) / 2
    • Jawaban GPT‑5.5 Instant berhasil pulih dari kesalahan awal, menemukan kesalahan aljabar yang sebenarnya, dan mencapai solusi yang benar

Komunikasi yang lebih ringkas

  • GPT‑5.5 Instant diubah untuk memberikan jawaban yang lebih pendek dan fokus tanpa kehilangan inti informasi
  • Sambil mempertahankan kehangatan dan kepribadian yang membuat ChatGPT nyaman digunakan, model ini menyampaikan informasi yang sama dengan lebih berguna dibanding model sebelumnya serta mengurangi jawaban bertele-tele dan format berlebihan
  • Model ini lebih jarang mengajukan pertanyaan lanjutan yang tidak perlu dan menghindari elemen yang membuat respons terasa berantakan, seperti emoji yang tidak perlu
  • Dalam contoh tentang cara meminta rekan kerja agar berbicara lebih singkat, GPT‑5.5 Instant menggunakan 30.2% lebih sedikit kata dan 29.2% lebih sedikit baris dibanding GPT‑5.3 Instant
  • GPT‑5.5 Instant tetap mempertahankan nada yang informal namun praktis dan aman dipakai di tempat kerja, menyediakan contoh kalimat sesuai situasi, serta membingkai masalah sebagai penetapan batas, bukan sebagai persoalan kepribadian rekan kerja
  • GPT‑5.3 Instant memang lebih lengkap hingga memiliki bagian “hal yang jangan dilakukan”, tetapi untuk prompt nasihat santai, jawabannya terasa agak terlalu terstruktur dan terlalu dipoles

Personalisasi dan kontrol

  • Instant memanfaatkan konteks dari chat sebelumnya, file, dan Gmail yang terhubung secara lebih efektif untuk membuat jawaban lebih personal
  • Model ini secara cerdas menilai kapan personalisasi tambahan dapat meningkatkan respons, serta mencari percakapan lama dengan lebih cepat untuk menemukan konteks yang relevan sehingga pengguna tidak perlu mengulang hal yang sama
  • Ini sangat berguna saat menerima saran atau rencana yang disesuaikan, atau ketika melanjutkan pekerjaan yang sedang berjalan
  • Dalam contoh ketika pengguna meminta rekomendasi teh, GPT‑5.3 Instant mencerminkan fakta bahwa pengguna berada di San Francisco dan memberi rekomendasi lokasi yang bersifat umum
  • GPT‑5.5 Instant memanfaatkan konteks sebelumnya bahwa pengguna sering pergi ke Asha Tea House dan lebih menyukai Taiwanese/high-mountain tea yang bersih daripada boba yang sangat manis, lalu memberi rekomendasi yang lebih presisi seperti Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas, dan Stonemill Matcha

memory sources

  • memory sources diperkenalkan ke semua model ChatGPT, menghadirkan kontrol baru untuk melihat konteks apa yang digunakan dalam personalisasi respons
  • Saat respons dipersonalisasi, pengguna dapat melihat konteks apa yang digunakan, seperti memori tersimpan atau chat sebelumnya, dan bisa menghapus atau mengubah informasi yang sudah usang atau tidak lagi relevan
  • Pada chat yang dibagikan, memory sources tidak ditampilkan kepada orang lain
  • Pengguna dapat menghapus chat yang tidak lagi ingin dikutip, menghapus atau mengubah item memori tersimpan di pengaturan, atau menggunakan chat sementara yang tidak menggunakan maupun memperbarui memori
  • memory sources dirancang agar personalisasi lebih mudah dipahami, tetapi mungkin tidak selalu menampilkan semua faktor yang memengaruhi jawaban
  • Sumber yang ditampilkan mungkin hanya sebagian chat lama yang paling relevan, bukan semua chat lama yang dicari atau dirujuk, dan tampilan ini akan ditingkatkan agar lebih komprehensif seiring waktu

Jadwal ketersediaan

  • GPT‑5.5 Instant mulai diluncurkan bertahap hari ini ke semua pengguna ChatGPT dan menggantikan GPT‑5.3 Instant sebagai model default
  • Di API, model ini tersedia sebagai chat-latest
  • Pengguna berbayar masih dapat terus menggunakan GPT‑5.3 Instant selama 3 bulan melalui pengaturan konfigurasi model, setelah itu GPT‑5.3 Instant akan dihentikan
  • Personalisasi yang ditingkatkan berbasis chat lama, file, dan Gmail terhubung sedang diluncurkan bertahap untuk pengguna Plus dan Pro di web, dan akan segera hadir di seluler
  • Dukungan untuk Free, Go, Business, dan Enterprise direncanakan meluas dalam beberapa minggu ke depan
  • memory sources sedang diluncurkan bertahap ke semua paket konsumen ChatGPT di web, dan juga akan segera hadir di seluler
  • Ketersediaan sumber personalisasi tertentu dapat berbeda menurut wilayah

1 komentar

 
GN⁺ 1 jam lalu
Komentar Hacker News
  • Kalau ingin melihat seperti apa “instant”, coba lihat chatjimmy.ai. Saya tidak terkait, tetapi kemungkinan yang terbuka untuk produk yang saya buat cukup mengejutkan
    Jika inferensi dalam hitungan milidetik memungkinkan bahkan pada model yang jauh lebih lama, permainannya berubah total. Menjalankan inferensi pada hampir setiap panggilan API tanpa latensi yang terasa benar-benar luar biasa

    • Ada info lebih lanjut soal ini? Saya pikir Groq juga cepat, tapi ini cepatnya sampai tidak masuk akal
      Edit: ternyata perusahaannya ini https://taalas.com/products/
    • Kalau gpt-4.1 bisa punya latensi dua digit milidetik, itu benar-benar bisa jadi game changer
  • GPT-5.3-instant sama sekali tidak terasa instan. Bahkan dengan upaya inferensi minimum pun, dalam skenario terbaik TTFT-nya sekitar 3~4 kali lebih lambat daripada GPT-4.1
    Tentu saja, yang menamainya “instant” adalah mereka sendiri, makanya saya bilang begitu. Ada kebutuhan nyata untuk menyegarkan kembali GPT-4.1, si pekerja keras pusat data
    Dan saat merilis model “instant”, bagaimana bisa mereka sama sekali tidak menyebutkan karakteristik latensi?

  • Saya penasaran apa bedanya ini dengan GPT 5.5 thinking yang upaya inferensinya disetel ke 0. Menarik sebagai keputusan produk untuk memisahkannya menjadi model yang berbeda

    • Pertanyaan bagus. GPT-5.5 thinking sangat pandai untuk tidak berpikir pada pertanyaan sederhana, jadi saya belum pernah merasa perlu memakai model instant bahkan untuk tanya jawab cepat
      Kalau begitu, model instant kemungkinan adalah model yang benar-benar berbeda dan lebih kecil, terutama ditujukan untuk menangani tier gratis ChatGPT
  • Apakah ini juga bisa dipakai di API? Saya tidak melihat instant, yang ada hanya chat

    • GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.

  • Semoga jawabannya terlihat lebih mudah dibaca, dan memang begitu dalam praktiknya. Model ChatGPT gratis biasa sekarang terlalu menyiksa

  • Ini berarti kecerdasannya naik banyak di tingkat harga termurah

  • Kenapa mereka tidak bisa lebih konsisten merilis model Instant dan Thinking secara bersamaan untuk setiap nomor versi? Saya tidak paham kenapa harus membuat keributan yang tumpang tindih seperti ini

    • Mungkin besar ini adalah versi yang dimodifikasi dari model thinking. Kalau begitu, untuk merilisnya bersamaan mereka harus menunda peluncuran model thinking
  • Bagus. Akhirnya ada sesuatu yang benar-benar bisa dipakai dan harganya terjangkau