18 poin oleh xguru 2025-10-07 | 1 komentar | Bagikan ke WhatsApp

App baru di dalam ChatGPT dan Apps SDK

  • Fitur untuk menggunakan aplikasi interaktif di dalam ChatGPT telah diperkenalkan
  • Aplikasi-aplikasi baru dirancang untuk berjalan secara alami di dalam alur percakapan, sehingga akan disarankan secara otomatis saat pengguna membutuhkannya
    • Contoh: “Spotify, buatkan playlist untuk pesta akhir pekan ini” → aplikasi berjalan otomatis dan memberikan hasil berbasis konteks
    • Saat berbicara tentang properti, aplikasi Zillow dapat disarankan untuk langsung menampilkan peta listing yang sesuai dengan anggaran
    • Mengubah outline yang dibuat di tengah percakapan menjadi slide melalui Canva
    • Mengikuti kursus Coursera sambil meminta penjelasan tambahan ke ChatGPT
  • Aplikasi menggabungkan perintah bahasa alami dan antarmuka visual untuk memberikan pengalaman yang lebih intuitif dibanding aplikasi web tradisional
  • Aplikasi mitra awal mencakup Booking.com, Canva, Coursera, Figma, Expedia, Spotify, Zillow
    • 11 aplikasi tambahan direncanakan hadir tahun ini: Doordash, Khan Academy, Instacart, Peloton, OpenTable, target, Uber,...
  • Proses pengajuan dan peninjauan aplikasi akan dimulai akhir tahun ini, dan akan diperkenalkan bertahap ke versi ChatGPT Business·Enterprise·Edu
  • Direktori aplikasi baru memungkinkan pengguna menjelajah dan mencari aplikasi, sementara aplikasi dengan desain dan fungsionalitas unggul akan mendapatkan rekomendasi di dalam percakapan dan penempatan teratas
  • Apps SDK

    • Developer dapat langsung membuat dan menguji aplikasi menggunakan versi pratinjau Apps SDK
    • SDK ini dibangun sebagai perluasan dari Model Context Protocol(MCP), sehingga memungkinkan pendefinisian logika aplikasi sekaligus antarmukanya
    • SDK dirilis sebagai open source, sehingga dapat dijalankan dengan standar yang sama di platform selain ChatGPT
    • Developer dapat terhubung langsung ke backend yang sudah ada, serta mendukung login dan akses ke fitur berbayar
  • Model monetisasi aplikasi di dalam ChatGPT dan fitur pembayaran instan berbasis Agentic Commerce Protocol dijadwalkan didukung tahun ini
  • Dengan ini, ChatGPT akan berevolusi dari sekadar asisten percakapan menjadi platform terintegrasi yang berinteraksi dengan ekosistem aplikasi

AgentKit dirilis – seperangkat alat lengkap untuk pengembangan, deployment, dan optimasi agen

  • AgentKit adalah penerus dari Responses API dan Agents SDK, sebuah platform terpadu yang menyederhanakan proses membangun agen dan meningkatkan keandalannya
  • Sebelumnya, hal-hal seperti connector, pipeline evaluasi, tuning prompt, dan pembangunan frontend harus ditangani secara terpisah, tetapi kini semuanya bisa dikelola secara terpadu dalam satu lingkungan
  • Agent Builder – alat desain workflow visual

    • Agent Builder menyediakan kanvas visual drag-and-drop untuk menyusun logika agen dan mengelola versinya
    • Dioptimalkan untuk pengembangan iteratif cepat, termasuk pratinjau eksekusi, pengaturan evaluasi inline, dan guardrail kustom (Guardrails)
    • Ramp menyatakan bahwa dengan alat ini, orkestrasi kompleks yang sebelumnya memakan waktu berbulan-bulan dapat diselesaikan dalam hitungan jam, dan siklus pengembangannya berkurang 70%
    • LY Corporation dari Jepang juga berhasil membangun workflow multi-agen pertamanya dalam 2 jam
    • Guardrails – perlindungan agen yang aman

      • Guardrails adalah lapisan keamanan open source yang menyediakan fungsi masking PII, deteksi jailbreak, dan pemblokiran respons abnormal
      • Melalui library Guardrails untuk Python dan JavaScript, alat ini bisa dijalankan secara mandiri atau digunakan terintegrasi di Agent Builder
  • Connector Registry – manajemen integrasi data

    • Connector Registry adalah panel manajemen terpadu untuk mengelola koneksi data secara terpusat di berbagai workspace dan organisasi
    • Mendukung connector bawaan seperti Dropbox, Google Drive, SharePoint, Microsoft Teams serta MCP pihak ketiga
    • Admin dapat mengelola domain, SSO, dan organisasi API secara terpadu melalui Global Admin Console, yang menjadi syarat untuk mengaktifkan Connector Registry
  • ChatKit – toolkit UI percakapan tertanam

    • ChatKit adalah toolkit untuk menyematkan UI chat untuk agen ke dalam produk dengan mudah
    • Mendukung otomatis penanganan respons streaming, manajemen thread percakapan, dan tampilan proses berpikir model
    • Dapat langsung disisipkan ke web atau aplikasi, dan tema dapat dikustomisasi agar sesuai dengan desain brand
    • Sudah digunakan untuk berbagai skenario seperti agen dukungan pelanggan HubSpot, serta asisten pengetahuan, panduan onboarding, dan pendamping riset
  • Evals – penguatan fitur pengukuran performa

    • Untuk membangun agen yang andal, empat fitur baru berikut ditambahkan ke Evals
      • Datasets: membangun dan memperluas set evaluasi dengan cepat melalui auto-grader dan anotasi manusia
      • Trace grading: mengevaluasi seluruh eksekusi workflow untuk mendeteksi titik lemah secara otomatis
      • Automated prompt optimization: perbaikan prompt otomatis berdasarkan hasil evaluasi
      • Third-party model support: dukungan agar model eksternal juga bisa dievaluasi
  • Reinforcement Fine-Tuning yang diperkuat

    • RFT memungkinkan developer menyesuaikan model reasoning OpenAI untuk tujuan tertentu
    • Sudah tersedia umum di model o4-mini, sementara RFT untuk GPT-5 berada pada tahap private beta dan sedang diuji oleh puluhan perusahaan
    • Fitur beta baru
      • Custom tool calls: melatih model agar memanggil tool yang tepat pada saat yang tepat
      • Custom graders: menetapkan kriteria evaluasi kustom sesuai use case tertentu
  • ChatKit dan Evals tersedia umum untuk semua developer mulai hari ini. Agent Builder dan Connector Registry akan dirilis bertahap dalam tahap beta, dan termasuk dalam paket harga model API standar
    • Opsi Workflows API dan deployment agen di dalam ChatGPT juga akan ditambahkan segera

Codex resmi diluncurkan – perluasan agen kode terintegrasi untuk tim developer

  • OpenAI mengumumkan peluncuran resmi Codex, platform agen kode berbasis cloud, dengan tiga fitur utama baru: integrasi Slack, Codex SDK, dan tool admin
  • Codex berjalan terintegrasi di lingkungan IDE, CLI, dan cloud berbasis model GPT-5-Codex
    • Sejak peluncuran, penggunaan hariannya naik 10 kali lipat dibanding Agustus, memproses 40 triliun token dalam tiga minggu dan dinilai sebagai salah satu model dengan pertumbuhan tercepat
  • Di internal OpenAI sendiri, lebih dari 70% engineer di seluruh perusahaan menggunakan Codex, sehingga jumlah PR merge mingguan naik 70%, dan sebagian besar code review dilakukan otomatis oleh Codex
  • Integrasi Slack

    • Saat menandai @Codex di channel tim, Codex akan mengumpulkan konteks percakapan secara otomatis dan memilih lingkungan yang sesuai untuk memberikan respons
    • Hasil kerja ditautkan melalui link Codex Cloud, sehingga perubahan bisa di-merge, diperbaiki berulang, atau diunduh secara lokal
    • Integrasi Slack memungkinkan code review, perbaikan otomatis, dan permintaan menjalankan build dilakukan secara natural dalam lingkungan pengembangan kolaboratif
  • Codex SDK

    • Codex SDK adalah kit pengembangan yang memungkinkan implementasi agen open source dari Codex CLI digunakan dengan cara yang sama di aplikasi eksternal
    • SDK lebih dulu tersedia untuk TypeScript, dengan dukungan bahasa lain menyusul
    • Fitur utama
      • Mem-parsing respons agen dengan output terstruktur
      • Manajemen konteks bawaan untuk melanjutkan sesi
      • Dukungan otomatisasi pipeline CI/CD melalui integrasi GitHub Action
      • Di lingkungan shell, dapat dijalankan langsung dengan perintah codex exec
    • Instacart mengintegrasikan SDK ini ke platform internalnya, Olive, untuk membangun lingkungan pengembangan otomatis end-to-end, dan mengonfirmasi dampaknya dalam mengurangi utang teknis serta meningkatkan kualitas kode
  • Penguatan fitur admin

    • Fitur kontrol dan penghapusan environment memungkinkan pengelolaan data sensitif dan pembersihan environment yang tidak diperlukan
    • Tersedia dashboard untuk menganalisis penggunaan Codex dan kualitas code review di CLI, IDE, dan web
    • Admin dapat mengendalikan kebijakan dan pengaturan penggunaan lokal Codex secara terpusat, sehingga cocok untuk operasi organisasi skala besar
    • Cisco menggunakan Codex untuk memangkas waktu review PR yang kompleks hingga 50%, sehingga engineer dapat lebih fokus pada pekerjaan yang lebih strategis
  • Integrasi Slack dan Codex SDK langsung tersedia di paket ChatGPT Plus, Pro, Business, Edu, Enterprise
  • Mulai 20 Oktober, beban kerja Codex Cloud akan dihitung ke dalam penggunaan
    • Paket Plus: sekitar 30~150 pesan lokal atau 5~40 pekerjaan cloud per 5 jam
    • Paket Pro: sekitar 300~1.500 pesan lokal atau 50~400 pekerjaan cloud per 5 jam
    • Jika batas terlampaui, penggunaan Codex akan dihentikan sementara, dan bisa digunakan kembali setelah kuota di-reset
    • Code Review untuk sementara tidak dihitung ke dalam penggunaan
      • Hanya jika tag @codex review digunakan di GitHub atau fitur auto review diaktifkan, penggunaan tersebut akan dihitung sebagai penggunaan Code Review

API pembuatan video berbasis Sora diperkenalkan

  • Sora adalah model media generatif generasi berikutnya dari OpenAI yang menghasilkan video realistis dan dinamis dengan audio
  • Model ini dikembangkan berdasarkan riset multi-modal diffusion, dan mempelajari pemahaman ruang 3D, pergerakan kamera, serta konsistensi gerakan fisik
  • Developer dapat menggunakannya untuk membuat konten otomatis dalam bentuk teks→video atau gambar→video
  • Video API yang baru diperkenalkan terdiri dari 5 endpoint fungsi utama berikut
    • Create video: membuat pekerjaan render baru dari prompt teks atau video yang sudah ada
    • Get video status: memeriksa status progres rendering
    • Download video: mengunduh video MP4 yang sudah selesai
    • List videos: mengelola daftar video yang dibuat dan mendukung paging
    • Delete videos: menghapus video tertentu dari penyimpanan
  • Melalui API ini, pekerjaan pembuatan, pengelolaan, perluasan, dan remix video dapat diotomatisasi secara terprogram
  • Jenis model

    • Sora 2 – untuk iterasi cepat dan eksperimen

      • Model yang berfokus pada kecepatan dan fleksibilitas, cocok untuk pengujian konsep atau pembuatan rough cut
      • Karena bisa mendapatkan hasil dalam waktu singkat, model ini cocok untuk membuat konten media sosial atau video prototipe
      • Fokus utamanya bukan kualitas sempurna, melainkan eksplorasi ide dan pengecekan arah visual
    • Sora 2 Pro – untuk produksi berkualitas tinggi

      • Model yang dirancang dengan target tingkat penyelesaian sinematik
      • Kecepatan rendering lebih lambat dan biaya lebih tinggi, tetapi stabilitas dan detail video meningkat secara signifikan
      • Cocok untuk video marketing resolusi tinggi, aset brand, dan produksi adegan bergaya film

GPT-5 Pro tersedia lewat API

  • GPT-5 Pro adalah model reasoning kelas tertinggi dari OpenAI, yang menggunakan komputasi lebih besar untuk menghasilkan respons yang lebih presisi dan akurat
  • Lebih lambat daripada GPT-5 biasa, tetapi menawarkan kemampuan pemecahan masalah kompleks dan kualitas yang konsisten
  • Ini adalah model khusus Responses API, mendukung permintaan percakapan multi-turn dan fitur API tingkat lanjut, dan hanya mendukung mode reasoning.effort: high
  • Tidak mendukung Code Interpreter maupun streaming real-time
  • Permintaan yang kompleks bisa memerlukan waktu pemrosesan hingga hitungan menit, dan untuk eksekusi jangka panjang disarankan menggunakan Background Mode
  • Context window 400.000 token, output maksimum 272.000 token, Knowledge Cutoff 30 September 2024
  • Harga (Pricing): per 1 juta token
    • Input: $15.00 (termasuk input gambar)
    • Output: $120.00

Model GPT Realtime Mini untuk layanan suara berbiaya rendah

  • GPT-Realtime-Mini adalah versi berbiaya rendah dan berkecepatan tinggi dari model percakapan real-time, mendukung input teks, gambar, dan audio serta menghasilkan output teks dan audio
  • Melalui koneksi WebRTC, WebSocket, dan SIP, model ini memungkinkan respons suara dan teks secara real-time, dengan biaya operasional lebih dari 6 kali lebih murah dibanding gpt-realtime
  • Context window 32.000 token, output maksimum 4.096 token, Knowledge Cutoff 1 Oktober 2023
  • Harga (Pricing): per 1 juta token
    • Token teks
      • Input: $0.60
      • Cached input: $0.06
      • Output: $2.40
      • Dibanding model yang ada
        • Input: gpt-realtime: $4 , GPT-5: $1.25, gpt-realtime-mini: $0.60 (paling murah)
        • Output: gpt-realtime: $16 , GPT-5: $10, gpt-realtime-mini: $2.4 (paling murah)
    • Token audio
      • Input: $10
      • Cached input: $0.3
      • Output: $20
    • Token gambar
      • Input: $0.8
      • Cached input: $0.08

Model GPT Image 1 Mini

  • GPT-Image-1-Mini adalah versi berbiaya rendah dari GPT Image 1, sebuah model multimodal yang menerima input teks dan gambar lalu menghasilkan output gambar
  • Berfokus pada efisiensi dan biaya rendah dibanding kualitas tertinggi, sehingga cocok untuk pembuatan gambar skala besar atau prototyping visual
  • Mendukung input teks dan gambar, dengan output khusus gambar
  • Lebih lambat, tetapi memiliki efisiensi biaya yang tinggi dibanding performanya
  • Harga (Pricing): per 1 juta token
    • Token teks
      • Input: $2.00
      • Cached input: $0.20
      • Output: $8.00
      • Dibanding model yang ada
        • Input: GPT Image 1: $5.00, GPT Image 1 Mini: $2.00 (hemat sekitar 60%)
        • Output: GPT Image 1: $20.00, GPT Image 1 Mini: $8.00 (hemat sekitar 60%)
    • Token gambar
      • Input: $2.50
      • Cached input: $0.25
      • Output: $8.00
    • Pembuatan gambar (per 1 gambar)
      • Kualitas Low
        • 1024×1024: $0.005
        • 1024×1536: $0.006
        • 1536×1024: $0.006
      • Kualitas Medium
        • 1024×1024: $0.011
        • 1024×1536: $0.015
        • 1536×1024: $0.015

1 komentar

 
laeyoung 2025-10-08

Seperti di Hacker News, ternyata suasananya juga lebih sepi dari perkiraan. Mungkin karena pengumuman dan peluncurannya terus dilakukan sedikit demi sedikit.