App baru di dalam ChatGPT dan Apps SDK
- Fitur untuk menggunakan aplikasi interaktif di dalam ChatGPT telah diperkenalkan
- Aplikasi-aplikasi baru dirancang untuk berjalan secara alami di dalam alur percakapan, sehingga akan disarankan secara otomatis saat pengguna membutuhkannya
- Contoh: “Spotify, buatkan playlist untuk pesta akhir pekan ini” → aplikasi berjalan otomatis dan memberikan hasil berbasis konteks
- Saat berbicara tentang properti, aplikasi Zillow dapat disarankan untuk langsung menampilkan peta listing yang sesuai dengan anggaran
- Mengubah outline yang dibuat di tengah percakapan menjadi slide melalui Canva
- Mengikuti kursus Coursera sambil meminta penjelasan tambahan ke ChatGPT
- Aplikasi menggabungkan perintah bahasa alami dan antarmuka visual untuk memberikan pengalaman yang lebih intuitif dibanding aplikasi web tradisional
- Aplikasi mitra awal mencakup Booking.com, Canva, Coursera, Figma, Expedia, Spotify, Zillow
- 11 aplikasi tambahan direncanakan hadir tahun ini: Doordash, Khan Academy, Instacart, Peloton, OpenTable, target, Uber,...
- Proses pengajuan dan peninjauan aplikasi akan dimulai akhir tahun ini, dan akan diperkenalkan bertahap ke versi ChatGPT Business·Enterprise·Edu
- Direktori aplikasi baru memungkinkan pengguna menjelajah dan mencari aplikasi, sementara aplikasi dengan desain dan fungsionalitas unggul akan mendapatkan rekomendasi di dalam percakapan dan penempatan teratas
-
Apps SDK
- Developer dapat langsung membuat dan menguji aplikasi menggunakan versi pratinjau Apps SDK
- SDK ini dibangun sebagai perluasan dari Model Context Protocol(MCP), sehingga memungkinkan pendefinisian logika aplikasi sekaligus antarmukanya
- SDK dirilis sebagai open source, sehingga dapat dijalankan dengan standar yang sama di platform selain ChatGPT
- Developer dapat terhubung langsung ke backend yang sudah ada, serta mendukung login dan akses ke fitur berbayar
- Model monetisasi aplikasi di dalam ChatGPT dan fitur pembayaran instan berbasis Agentic Commerce Protocol dijadwalkan didukung tahun ini
- Dengan ini, ChatGPT akan berevolusi dari sekadar asisten percakapan menjadi platform terintegrasi yang berinteraksi dengan ekosistem aplikasi
AgentKit dirilis – seperangkat alat lengkap untuk pengembangan, deployment, dan optimasi agen
- AgentKit adalah penerus dari Responses API dan Agents SDK, sebuah platform terpadu yang menyederhanakan proses membangun agen dan meningkatkan keandalannya
- Sebelumnya, hal-hal seperti connector, pipeline evaluasi, tuning prompt, dan pembangunan frontend harus ditangani secara terpisah, tetapi kini semuanya bisa dikelola secara terpadu dalam satu lingkungan
-
Agent Builder – alat desain workflow visual
- Agent Builder menyediakan kanvas visual drag-and-drop untuk menyusun logika agen dan mengelola versinya
- Dioptimalkan untuk pengembangan iteratif cepat, termasuk pratinjau eksekusi, pengaturan evaluasi inline, dan guardrail kustom (Guardrails)
- Ramp menyatakan bahwa dengan alat ini, orkestrasi kompleks yang sebelumnya memakan waktu berbulan-bulan dapat diselesaikan dalam hitungan jam, dan siklus pengembangannya berkurang 70%
- LY Corporation dari Jepang juga berhasil membangun workflow multi-agen pertamanya dalam 2 jam
-
Guardrails – perlindungan agen yang aman
- Guardrails adalah lapisan keamanan open source yang menyediakan fungsi masking PII, deteksi jailbreak, dan pemblokiran respons abnormal
- Melalui library Guardrails untuk Python dan JavaScript, alat ini bisa dijalankan secara mandiri atau digunakan terintegrasi di Agent Builder
-
Connector Registry – manajemen integrasi data
- Connector Registry adalah panel manajemen terpadu untuk mengelola koneksi data secara terpusat di berbagai workspace dan organisasi
- Mendukung connector bawaan seperti Dropbox, Google Drive, SharePoint, Microsoft Teams serta MCP pihak ketiga
- Admin dapat mengelola domain, SSO, dan organisasi API secara terpadu melalui Global Admin Console, yang menjadi syarat untuk mengaktifkan Connector Registry
-
ChatKit – toolkit UI percakapan tertanam
- ChatKit adalah toolkit untuk menyematkan UI chat untuk agen ke dalam produk dengan mudah
- Mendukung otomatis penanganan respons streaming, manajemen thread percakapan, dan tampilan proses berpikir model
- Dapat langsung disisipkan ke web atau aplikasi, dan tema dapat dikustomisasi agar sesuai dengan desain brand
- Sudah digunakan untuk berbagai skenario seperti agen dukungan pelanggan HubSpot, serta asisten pengetahuan, panduan onboarding, dan pendamping riset
-
Evals – penguatan fitur pengukuran performa
- Untuk membangun agen yang andal, empat fitur baru berikut ditambahkan ke Evals
- Datasets: membangun dan memperluas set evaluasi dengan cepat melalui auto-grader dan anotasi manusia
- Trace grading: mengevaluasi seluruh eksekusi workflow untuk mendeteksi titik lemah secara otomatis
- Automated prompt optimization: perbaikan prompt otomatis berdasarkan hasil evaluasi
- Third-party model support: dukungan agar model eksternal juga bisa dievaluasi
-
Reinforcement Fine-Tuning yang diperkuat
- RFT memungkinkan developer menyesuaikan model reasoning OpenAI untuk tujuan tertentu
- Sudah tersedia umum di model o4-mini, sementara RFT untuk GPT-5 berada pada tahap private beta dan sedang diuji oleh puluhan perusahaan
- Fitur beta baru
- Custom tool calls: melatih model agar memanggil tool yang tepat pada saat yang tepat
- Custom graders: menetapkan kriteria evaluasi kustom sesuai use case tertentu
- ChatKit dan Evals tersedia umum untuk semua developer mulai hari ini. Agent Builder dan Connector Registry akan dirilis bertahap dalam tahap beta, dan termasuk dalam paket harga model API standar
- Opsi Workflows API dan deployment agen di dalam ChatGPT juga akan ditambahkan segera
Codex resmi diluncurkan – perluasan agen kode terintegrasi untuk tim developer
- OpenAI mengumumkan peluncuran resmi Codex, platform agen kode berbasis cloud, dengan tiga fitur utama baru: integrasi Slack, Codex SDK, dan tool admin
- Codex berjalan terintegrasi di lingkungan IDE, CLI, dan cloud berbasis model GPT-5-Codex
- Sejak peluncuran, penggunaan hariannya naik 10 kali lipat dibanding Agustus, memproses 40 triliun token dalam tiga minggu dan dinilai sebagai salah satu model dengan pertumbuhan tercepat
- Di internal OpenAI sendiri, lebih dari 70% engineer di seluruh perusahaan menggunakan Codex, sehingga jumlah PR merge mingguan naik 70%, dan sebagian besar code review dilakukan otomatis oleh Codex
-
Integrasi Slack
- Saat menandai
@Codex di channel tim, Codex akan mengumpulkan konteks percakapan secara otomatis dan memilih lingkungan yang sesuai untuk memberikan respons
- Hasil kerja ditautkan melalui link Codex Cloud, sehingga perubahan bisa di-merge, diperbaiki berulang, atau diunduh secara lokal
- Integrasi Slack memungkinkan code review, perbaikan otomatis, dan permintaan menjalankan build dilakukan secara natural dalam lingkungan pengembangan kolaboratif
-
Codex SDK
- Codex SDK adalah kit pengembangan yang memungkinkan implementasi agen open source dari Codex CLI digunakan dengan cara yang sama di aplikasi eksternal
- SDK lebih dulu tersedia untuk TypeScript, dengan dukungan bahasa lain menyusul
- Fitur utama
- Mem-parsing respons agen dengan output terstruktur
- Manajemen konteks bawaan untuk melanjutkan sesi
- Dukungan otomatisasi pipeline CI/CD melalui integrasi GitHub Action
- Di lingkungan shell, dapat dijalankan langsung dengan perintah
codex exec
- Instacart mengintegrasikan SDK ini ke platform internalnya, Olive, untuk membangun lingkungan pengembangan otomatis end-to-end, dan mengonfirmasi dampaknya dalam mengurangi utang teknis serta meningkatkan kualitas kode
-
Penguatan fitur admin
- Fitur kontrol dan penghapusan environment memungkinkan pengelolaan data sensitif dan pembersihan environment yang tidak diperlukan
- Tersedia dashboard untuk menganalisis penggunaan Codex dan kualitas code review di CLI, IDE, dan web
- Admin dapat mengendalikan kebijakan dan pengaturan penggunaan lokal Codex secara terpusat, sehingga cocok untuk operasi organisasi skala besar
- Cisco menggunakan Codex untuk memangkas waktu review PR yang kompleks hingga 50%, sehingga engineer dapat lebih fokus pada pekerjaan yang lebih strategis
- Integrasi Slack dan Codex SDK langsung tersedia di paket ChatGPT Plus, Pro, Business, Edu, Enterprise
- Mulai 20 Oktober, beban kerja Codex Cloud akan dihitung ke dalam penggunaan
- Paket Plus: sekitar 30~150 pesan lokal atau 5~40 pekerjaan cloud per 5 jam
- Paket Pro: sekitar 300~1.500 pesan lokal atau 50~400 pekerjaan cloud per 5 jam
- Jika batas terlampaui, penggunaan Codex akan dihentikan sementara, dan bisa digunakan kembali setelah kuota di-reset
- Code Review untuk sementara tidak dihitung ke dalam penggunaan
- Hanya jika tag
@codex review digunakan di GitHub atau fitur auto review diaktifkan, penggunaan tersebut akan dihitung sebagai penggunaan Code Review
API pembuatan video berbasis Sora diperkenalkan
- Sora adalah model media generatif generasi berikutnya dari OpenAI yang menghasilkan video realistis dan dinamis dengan audio
- Model ini dikembangkan berdasarkan riset multi-modal diffusion, dan mempelajari pemahaman ruang 3D, pergerakan kamera, serta konsistensi gerakan fisik
- Developer dapat menggunakannya untuk membuat konten otomatis dalam bentuk teks→video atau gambar→video
- Video API yang baru diperkenalkan terdiri dari 5 endpoint fungsi utama berikut
- Create video: membuat pekerjaan render baru dari prompt teks atau video yang sudah ada
- Get video status: memeriksa status progres rendering
- Download video: mengunduh video MP4 yang sudah selesai
- List videos: mengelola daftar video yang dibuat dan mendukung paging
- Delete videos: menghapus video tertentu dari penyimpanan
- Melalui API ini, pekerjaan pembuatan, pengelolaan, perluasan, dan remix video dapat diotomatisasi secara terprogram
-
Jenis model
-
Sora 2 – untuk iterasi cepat dan eksperimen
- Model yang berfokus pada kecepatan dan fleksibilitas, cocok untuk pengujian konsep atau pembuatan rough cut
- Karena bisa mendapatkan hasil dalam waktu singkat, model ini cocok untuk membuat konten media sosial atau video prototipe
- Fokus utamanya bukan kualitas sempurna, melainkan eksplorasi ide dan pengecekan arah visual
-
Sora 2 Pro – untuk produksi berkualitas tinggi
- Model yang dirancang dengan target tingkat penyelesaian sinematik
- Kecepatan rendering lebih lambat dan biaya lebih tinggi, tetapi stabilitas dan detail video meningkat secara signifikan
- Cocok untuk video marketing resolusi tinggi, aset brand, dan produksi adegan bergaya film
GPT-5 Pro tersedia lewat API
- GPT-5 Pro adalah model reasoning kelas tertinggi dari OpenAI, yang menggunakan komputasi lebih besar untuk menghasilkan respons yang lebih presisi dan akurat
- Lebih lambat daripada GPT-5 biasa, tetapi menawarkan kemampuan pemecahan masalah kompleks dan kualitas yang konsisten
- Ini adalah model khusus Responses API, mendukung permintaan percakapan multi-turn dan fitur API tingkat lanjut, dan hanya mendukung mode
reasoning.effort: high
- Tidak mendukung Code Interpreter maupun streaming real-time
- Permintaan yang kompleks bisa memerlukan waktu pemrosesan hingga hitungan menit, dan untuk eksekusi jangka panjang disarankan menggunakan Background Mode
- Context window 400.000 token, output maksimum 272.000 token, Knowledge Cutoff 30 September 2024
- Harga (Pricing): per 1 juta token
- Input: $15.00 (termasuk input gambar)
- Output: $120.00
Model GPT Realtime Mini untuk layanan suara berbiaya rendah
- GPT-Realtime-Mini adalah versi berbiaya rendah dan berkecepatan tinggi dari model percakapan real-time, mendukung input teks, gambar, dan audio serta menghasilkan output teks dan audio
- Melalui koneksi WebRTC, WebSocket, dan SIP, model ini memungkinkan respons suara dan teks secara real-time, dengan biaya operasional lebih dari 6 kali lebih murah dibanding gpt-realtime
- Context window 32.000 token, output maksimum 4.096 token, Knowledge Cutoff 1 Oktober 2023
- Harga (Pricing): per 1 juta token
- Token teks
- Input: $0.60
- Cached input: $0.06
- Output: $2.40
- Dibanding model yang ada
- Input: gpt-realtime: $4 , GPT-5: $1.25, gpt-realtime-mini: $0.60 (paling murah)
- Output: gpt-realtime: $16 , GPT-5: $10, gpt-realtime-mini: $2.4 (paling murah)
- Token audio
- Input: $10
- Cached input: $0.3
- Output: $20
- Token gambar
- Input: $0.8
- Cached input: $0.08
Model GPT Image 1 Mini
- GPT-Image-1-Mini adalah versi berbiaya rendah dari GPT Image 1, sebuah model multimodal yang menerima input teks dan gambar lalu menghasilkan output gambar
- Berfokus pada efisiensi dan biaya rendah dibanding kualitas tertinggi, sehingga cocok untuk pembuatan gambar skala besar atau prototyping visual
- Mendukung input teks dan gambar, dengan output khusus gambar
- Lebih lambat, tetapi memiliki efisiensi biaya yang tinggi dibanding performanya
- Harga (Pricing): per 1 juta token
- Token teks
- Input: $2.00
- Cached input: $0.20
- Output: $8.00
- Dibanding model yang ada
- Input: GPT Image 1: $5.00, GPT Image 1 Mini: $2.00 (hemat sekitar 60%)
- Output: GPT Image 1: $20.00, GPT Image 1 Mini: $8.00 (hemat sekitar 60%)
- Token gambar
- Input: $2.50
- Cached input: $0.25
- Output: $8.00
- Pembuatan gambar (per 1 gambar)
- Kualitas Low
- 1024×1024: $0.005
- 1024×1536: $0.006
- 1536×1024: $0.006
- Kualitas Medium
- 1024×1024: $0.011
- 1024×1536: $0.015
- 1536×1024: $0.015
1 komentar
Seperti di Hacker News, ternyata suasananya juga lebih sepi dari perkiraan. Mungkin karena pengumuman dan peluncurannya terus dilakukan sedikit demi sedikit.