- OpenAI melakukan pembaruan besar pada Agents SDK, menghadirkan infrastruktur terstandarisasi agar agen dapat melakukan inspeksi file, menjalankan perintah, mengedit kode, dan menangani pekerjaan jangka panjang di lingkungan sandbox yang terkontrol
- Harness baru ini mengintegrasikan memori yang dapat dikonfigurasi, orkestrasi yang sadar sandbox, alat filesystem bergaya Codex, serta primitif utama sistem agen frontier seperti MCP, skills, AGENTS.md, shell, dan apply patch
- Dengan dukungan eksekusi sandbox native, tersedia dukungan bawaan untuk berbagai penyedia sandbox seperti Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, dan Vercel, atau dapat pula dihubungkan ke sandbox milik sendiri
- Arsitektur pemisahan harness dan komputasi menghadirkan keamanan serta skalabilitas seperti pertahanan terhadap prompt injection, eksekusi tahan lama berbasis snapshot, dan paralelisasi multi-container
- Tersedia secara umum (GA) untuk semua pelanggan dengan penagihan standar berbasis token API dan penggunaan alat, sementara dukungan TypeScript serta fitur code mode dan subagents akan hadir kemudian
Keterbatasan sistem agen yang ada saat ini
- Untuk membangun agen yang berguna, developer membutuhkan bukan hanya model terbaik, tetapi juga sistem yang mendukung inspeksi file, eksekusi perintah, penulisan kode, dan pemeliharaan alur kerja multi-langkah
- Trade-off dari pendekatan yang ada saat ini
- Framework yang agnostik terhadap model fleksibel, tetapi tidak selalu bisa memanfaatkan sepenuhnya kemampuan model frontier
- SDK dari penyedia model lebih dekat ke model, tetapi sering kali kurang memberi visibilitas terhadap harness
- Managed agent API menyederhanakan deployment, tetapi membatasi lokasi eksekusi agen dan cara agen mengakses data sensitif
Harness yang lebih kuat untuk agent loop
- Melalui rilis ini, harness Agents SDK memberikan kemampuan yang lebih kuat untuk agen yang bekerja dengan dokumen, file, dan sistem
- Primitif utama yang kini terintegrasi
- Penggunaan alat melalui MCP
- Progressive disclosure melalui skills
- Custom instruction melalui AGENTS.md
- Eksekusi kode melalui alat shell
- Pengeditan file melalui alat apply patch
- Karena harness ini akan terus mengintegrasikan pola agentic dan primitif baru seiring waktu, developer dapat fokus pada logika spesifik domain alih-alih terus memperbarui infrastruktur inti
- Harness menyelaraskan eksekusi dengan cara model frontier mencapai performa terbaik, sehingga meningkatkan stabilitas dan performa, terutama pada tugas jangka panjang atau pekerjaan kompleks yang membutuhkan koordinasi lintas alat dan sistem
- Dirancang untuk mendukung kebutuhan unik tiap produk, sehingga penggunaan alat, memori, dan lingkungan sandbox dapat disesuaikan secara fleksibel dengan stack yang sudah dimiliki developer
Eksekusi sandbox native
- Agents SDK yang diperbarui kini mendukung eksekusi sandbox secara native, sehingga agen dapat berjalan di lingkungan komputasi terkontrol yang telah dilengkapi file, alat, dan dependensi yang dibutuhkan untuk menyelesaikan tugas
- Banyak agen yang berguna memerlukan workspace yang memungkinkan baca/tulis file, instalasi dependensi, eksekusi kode, dan penggunaan alat secara aman; dukungan sandbox native menyediakan ini secara bawaan tanpa perlu konfigurasi terpisah
- Bisa membawa sandbox sendiri atau memanfaatkan dukungan bawaan untuk Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel, dan lainnya
- Diperkenalkan abstraksi Manifest untuk membuat lingkungan dapat dipindahkan antar penyedia
- Mendukung mount file lokal dan definisi direktori output
- Mendukung pengambilan data dari penyedia storage seperti AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2
- Memberikan developer cara konfigurasi lingkungan yang konsisten dari prototipe lokal hingga deployment produksi
- Memberikan model workspace yang dapat diprediksi terkait lokasi input, lokasi output, dan cara merapikan pekerjaan selama tugas berjalan lama
Pemisahan harness-komputasi untuk keamanan, durabilitas, dan skalabilitas
- Sistem agen harus dirancang dengan asumsi adanya prompt injection dan upaya kebocoran data, dan pemisahan harness serta komputasi membantu mengisolasi kredensial dari lingkungan tempat kode hasil generasi model dijalankan
- Dukungan untuk durable execution
- Jika status agen dieksternalisasi, hilangnya container sandbox tidak berarti eksekusi ikut hilang
- Dengan snapshotting dan rehydration bawaan, jika lingkungan asli gagal atau kedaluwarsa, status dapat dipulihkan dari checkpoint terakhir di container baru lalu eksekusi dilanjutkan
- Peningkatan skalabilitas
- Eksekusi agen dapat menggunakan satu atau beberapa sandbox
- Sandbox hanya dipanggil saat diperlukan, dan subagent dapat diarahkan ke lingkungan yang terisolasi
- Paralelisasi multi-container mendukung eksekusi yang lebih cepat
Studi kasus pelanggan Oscar Health
- Menurut Rachael Burns, Staff Engineer & AI Tech Lead di Oscar Health, Agents SDK yang diperbarui memungkinkan otomatisasi workflow catatan klinis pada tingkat production yang sebelumnya tidak dapat ditangani dengan cukup andal oleh pendekatan lama
- Pembeda utamanya bukan sekadar ekstraksi metadata sederhana, melainkan memahami secara akurat setiap encounter boundary dalam catatan yang panjang dan kompleks
- Hasilnya, mereka dapat lebih cepat memahami konteks kunjungan tiap pasien dan berkontribusi pada peningkatan perawatan serta pengalaman pasien
Harga dan ketersediaan
- Fitur baru Agents SDK tersedia melalui API dan sudah general availability (GA) untuk semua pelanggan
- Menggunakan kebijakan harga API standar dengan penagihan berbasis token dan penggunaan alat
Rencana ke depan
- Agents SDK akan terus dikembangkan agar agen yang lebih kuat dapat masuk ke production dengan infrastruktur kustom yang lebih sedikit, sambil tetap mempertahankan fleksibilitas dan kontrol bagi developer
- Harness baru dan fitur sandbox dirilis lebih dulu di Python, sementara dukungan TypeScript akan hadir di rilis mendatang
- Fitur code mode dan subagents sedang dikerjakan untuk Python maupun TypeScript
- Dukungan integrasi ekosistem agen akan diperluas lewat lebih banyak penyedia sandbox, integrasi, dan cara menghubungkan alat serta sistem yang sudah digunakan developer
Belum ada komentar.