Evolusi Generasi Berikutnya dari Agents SDK

(openai.com)

7 poin oleh GN⁺ 2026-04-16 | Belum ada komentar. | Bagikan ke WhatsApp

OpenAI memperbarui Agents SDK secara besar-besaran, menghadirkan infrastruktur terstandarisasi agar agen dapat melakukan inspeksi file, menjalankan perintah, mengedit kode, dan menangani tugas jangka panjang di lingkungan sandbox yang terkontrol
Harness baru ini mengintegrasikan memori yang dapat dikonfigurasi, orkestrasi yang sadar sandbox, alat filesystem bergaya Codex, serta primitif utama sistem agen frontier seperti MCP, skills, AGENTS.md, shell, dan apply patch
Dengan dukungan eksekusi sandbox native, tersedia dukungan bawaan untuk berbagai penyedia sandbox seperti Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, dan Vercel, atau dapat pula menghubungkan sandbox milik sendiri
Arsitektur pemisahan antara harness dan komputasi menghadirkan pertahanan terhadap prompt injection, eksekusi tahan lama berbasis snapshot, dan paralelisasi multi-container untuk keamanan serta skalabilitas
Fitur ini tersedia umum (GA) untuk semua pelanggan dengan penagihan standar berbasis token API dan penggunaan alat, dan dukungan TypeScript serta fitur code mode dan subagents akan ditambahkan ke depannya

Keterbatasan sistem agen yang ada saat ini

Untuk membangun agen yang berguna, pengembang memerlukan bukan hanya model terbaik, tetapi juga sistem yang mendukung inspeksi file, eksekusi perintah, penulisan kode, dan pemeliharaan tugas multilangkah
Trade-off dari pendekatan yang ada saat ini
- Framework yang independen dari model bersifat fleksibel, tetapi tidak selalu dapat memanfaatkan sepenuhnya kemampuan model frontier
- SDK dari penyedia model lebih dekat ke model, tetapi sering kali kurang memiliki visibilitas terhadap harness
- Managed agent API menyederhanakan deployment, tetapi membatasi tempat eksekusi agen dan cara agen mengakses data sensitif

Melalui rilis ini, harness Agents SDK menghadirkan kemampuan yang lebih kuat untuk agen yang menangani dokumen, file, dan sistem
Primitif utama yang baru diintegrasikan
- Penggunaan alat melalui MCP
- Progressive disclosure melalui skills
- Instruksi kustom melalui AGENTS.md
- Eksekusi kode melalui alat shell
- Pengeditan file melalui alat apply patch
Karena harness ini akan terus mengintegrasikan pola agentic dan primitif baru seiring waktu, pengembang dapat berfokus pada logika spesifik domain alih-alih pembaruan infrastruktur inti
Harness ini meningkatkan stabilitas dan performa, terutama pada tugas kompleks yang berjalan lama atau membutuhkan koordinasi antarbanyak alat dan sistem, dengan menyelaraskan eksekusi dengan cara model frontier bekerja paling optimal
Dirancang untuk mendukung kebutuhan unik tiap produk, sehingga penggunaan alat, memori, lingkungan sandbox, dan lainnya dapat disesuaikan secara fleksibel dengan stack yang sudah dimiliki pengembang

Agents SDK yang diperbarui kini mendukung eksekusi sandbox secara native, sehingga agen dapat berjalan di lingkungan komputasi yang terkontrol dengan file, alat, dan dependensi yang dibutuhkan untuk tugasnya
Banyak agen yang bermanfaat memerlukan workspace yang memungkinkan baca/tulis file, pemasangan dependensi, eksekusi kode, dan penggunaan alat secara aman, dan dukungan sandbox native menyediakan ini secara bawaan tanpa perlu konfigurasi terpisah
Dapat membawa sandbox sendiri atau memanfaatkan dukungan bawaan untuk Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel dan lainnya
Untuk membuat lingkungan dapat dipindahkan antarberbagai penyedia, diperkenalkan abstraksi Manifest
- Dapat melakukan mount file lokal dan mendefinisikan direktori output
- Mendukung pengambilan data dari penyedia storage seperti AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2
Memberikan kepada pengembang cara konfigurasi lingkungan yang konsisten dari prototipe lokal hingga deployment produksi
Memberikan kepada model workspace yang dapat diprediksi mengenai lokasi input, lokasi output, dan cara menata pekerjaan selama tugas yang berjalan lama

Sistem agen harus dirancang dengan asumsi adanya upaya prompt injection dan kebocoran data, dan pemisahan antara harness dan komputasi membantu mengisolasi kredensial dari lingkungan tempat kode hasil generasi model dijalankan
Dukungan untuk eksekusi tahan lama (durable execution)
- Jika status agen dieksternalkan, hilangnya container sandbox tidak berarti eksekusi ikut hilang
- Dengan snapshotting dan rehydration bawaan, ketika lingkungan asli gagal atau kedaluwarsa, status dapat dipulihkan dari checkpoint terakhir di container baru dan eksekusi dapat dilanjutkan
Peningkatan skalabilitas
- Eksekusi agen dapat menggunakan satu atau banyak sandbox
- Sandbox dipanggil hanya saat diperlukan, dan subagen dapat diarahkan ke lingkungan yang terisolasi
- Paralelisasi multi-container mendukung eksekusi yang lebih cepat

Menurut Rachael Burns, Staff Engineer & AI Tech Lead di Oscar Health, Agents SDK yang diperbarui memungkinkan otomatisasi workflow catatan klinis pada tingkat produksi yang sebelumnya tidak cukup andal ditangani dengan pendekatan lama
Pembeda utamanya bukan sekadar ekstraksi metadata sederhana, melainkan kemampuan untuk memahami secara akurat tiap encounter boundary dalam catatan yang panjang dan kompleks
Hasilnya, kondisi tiap kunjungan pasien dapat dipahami lebih cepat, sehingga berkontribusi pada peningkatan layanan dan pengalaman pasien

Fitur baru Agents SDK tersedia melalui API dan tersedia umum (GA) untuk semua pelanggan
Berlaku kebijakan harga API standar (penagihan berbasis token dan penggunaan alat)

Agents SDK akan terus dikembangkan untuk membantu menghadirkan agen yang lebih kuat ke produksi dengan infrastruktur kustom yang lebih sedikit, sambil tetap mempertahankan fleksibilitas dan kontrol bagi pengembang
Harness baru dan fitur sandbox lebih dulu dirilis di Python, sementara dukungan TypeScript dijadwalkan pada rilis mendatang
Fitur code mode dan subagents sedang dikerjakan untuk ditambahkan baik ke Python maupun TypeScript
Dukungan akan diperluas ke lebih banyak penyedia sandbox, integrasi, serta cara menghubungkan alat dan sistem yang sudah digunakan pengembang, untuk memperkuat integrasi ekosistem agen