7 poin oleh GN⁺ 2026-04-16 | Belum ada komentar. | Bagikan ke WhatsApp
  • OpenAI memperbarui Agents SDK secara besar-besaran, menghadirkan infrastruktur terstandarisasi agar agen dapat melakukan inspeksi file, menjalankan perintah, mengedit kode, dan menangani tugas jangka panjang di lingkungan sandbox yang terkontrol
  • Harness baru ini mengintegrasikan memori yang dapat dikonfigurasi, orkestrasi yang sadar sandbox, alat filesystem bergaya Codex, serta primitif utama sistem agen frontier seperti MCP, skills, AGENTS.md, shell, dan apply patch
  • Dengan dukungan eksekusi sandbox native, tersedia dukungan bawaan untuk berbagai penyedia sandbox seperti Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, dan Vercel, atau dapat pula menghubungkan sandbox milik sendiri
  • Arsitektur pemisahan antara harness dan komputasi menghadirkan pertahanan terhadap prompt injection, eksekusi tahan lama berbasis snapshot, dan paralelisasi multi-container untuk keamanan serta skalabilitas
  • Fitur ini tersedia umum (GA) untuk semua pelanggan dengan penagihan standar berbasis token API dan penggunaan alat, dan dukungan TypeScript serta fitur code mode dan subagents akan ditambahkan ke depannya

Keterbatasan sistem agen yang ada saat ini

  • Untuk membangun agen yang berguna, pengembang memerlukan bukan hanya model terbaik, tetapi juga sistem yang mendukung inspeksi file, eksekusi perintah, penulisan kode, dan pemeliharaan tugas multilangkah
  • Trade-off dari pendekatan yang ada saat ini
    • Framework yang independen dari model bersifat fleksibel, tetapi tidak selalu dapat memanfaatkan sepenuhnya kemampuan model frontier
    • SDK dari penyedia model lebih dekat ke model, tetapi sering kali kurang memiliki visibilitas terhadap harness
    • Managed agent API menyederhanakan deployment, tetapi membatasi tempat eksekusi agen dan cara agen mengakses data sensitif

Harness yang lebih kuat untuk loop agen

  • Melalui rilis ini, harness Agents SDK menghadirkan kemampuan yang lebih kuat untuk agen yang menangani dokumen, file, dan sistem
  • Primitif utama yang baru diintegrasikan
    • Penggunaan alat melalui MCP
    • Progressive disclosure melalui skills
    • Instruksi kustom melalui AGENTS.md
    • Eksekusi kode melalui alat shell
    • Pengeditan file melalui alat apply patch
  • Karena harness ini akan terus mengintegrasikan pola agentic dan primitif baru seiring waktu, pengembang dapat berfokus pada logika spesifik domain alih-alih pembaruan infrastruktur inti
  • Harness ini meningkatkan stabilitas dan performa, terutama pada tugas kompleks yang berjalan lama atau membutuhkan koordinasi antarbanyak alat dan sistem, dengan menyelaraskan eksekusi dengan cara model frontier bekerja paling optimal
  • Dirancang untuk mendukung kebutuhan unik tiap produk, sehingga penggunaan alat, memori, lingkungan sandbox, dan lainnya dapat disesuaikan secara fleksibel dengan stack yang sudah dimiliki pengembang

Eksekusi sandbox native

  • Agents SDK yang diperbarui kini mendukung eksekusi sandbox secara native, sehingga agen dapat berjalan di lingkungan komputasi yang terkontrol dengan file, alat, dan dependensi yang dibutuhkan untuk tugasnya
  • Banyak agen yang bermanfaat memerlukan workspace yang memungkinkan baca/tulis file, pemasangan dependensi, eksekusi kode, dan penggunaan alat secara aman, dan dukungan sandbox native menyediakan ini secara bawaan tanpa perlu konfigurasi terpisah
  • Dapat membawa sandbox sendiri atau memanfaatkan dukungan bawaan untuk Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel dan lainnya
  • Untuk membuat lingkungan dapat dipindahkan antarberbagai penyedia, diperkenalkan abstraksi Manifest
    • Dapat melakukan mount file lokal dan mendefinisikan direktori output
    • Mendukung pengambilan data dari penyedia storage seperti AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2
  • Memberikan kepada pengembang cara konfigurasi lingkungan yang konsisten dari prototipe lokal hingga deployment produksi
  • Memberikan kepada model workspace yang dapat diprediksi mengenai lokasi input, lokasi output, dan cara menata pekerjaan selama tugas yang berjalan lama

Pemisahan harness-komputasi untuk keamanan, ketahanan, dan skalabilitas

  • Sistem agen harus dirancang dengan asumsi adanya upaya prompt injection dan kebocoran data, dan pemisahan antara harness dan komputasi membantu mengisolasi kredensial dari lingkungan tempat kode hasil generasi model dijalankan
  • Dukungan untuk eksekusi tahan lama (durable execution)
    • Jika status agen dieksternalkan, hilangnya container sandbox tidak berarti eksekusi ikut hilang
    • Dengan snapshotting dan rehydration bawaan, ketika lingkungan asli gagal atau kedaluwarsa, status dapat dipulihkan dari checkpoint terakhir di container baru dan eksekusi dapat dilanjutkan
  • Peningkatan skalabilitas
    • Eksekusi agen dapat menggunakan satu atau banyak sandbox
    • Sandbox dipanggil hanya saat diperlukan, dan subagen dapat diarahkan ke lingkungan yang terisolasi
    • Paralelisasi multi-container mendukung eksekusi yang lebih cepat

Studi kasus pelanggan Oscar Health

  • Menurut Rachael Burns, Staff Engineer & AI Tech Lead di Oscar Health, Agents SDK yang diperbarui memungkinkan otomatisasi workflow catatan klinis pada tingkat produksi yang sebelumnya tidak cukup andal ditangani dengan pendekatan lama
  • Pembeda utamanya bukan sekadar ekstraksi metadata sederhana, melainkan kemampuan untuk memahami secara akurat tiap encounter boundary dalam catatan yang panjang dan kompleks
  • Hasilnya, kondisi tiap kunjungan pasien dapat dipahami lebih cepat, sehingga berkontribusi pada peningkatan layanan dan pengalaman pasien

Harga dan ketersediaan

  • Fitur baru Agents SDK tersedia melalui API dan tersedia umum (GA) untuk semua pelanggan
  • Berlaku kebijakan harga API standar (penagihan berbasis token dan penggunaan alat)

Rencana ke depan

  • Agents SDK akan terus dikembangkan untuk membantu menghadirkan agen yang lebih kuat ke produksi dengan infrastruktur kustom yang lebih sedikit, sambil tetap mempertahankan fleksibilitas dan kontrol bagi pengembang
  • Harness baru dan fitur sandbox lebih dulu dirilis di Python, sementara dukungan TypeScript dijadwalkan pada rilis mendatang
  • Fitur code mode dan subagents sedang dikerjakan untuk ditambahkan baik ke Python maupun TypeScript
  • Dukungan akan diperluas ke lebih banyak penyedia sandbox, integrasi, serta cara menghubungkan alat dan sistem yang sudah digunakan pengembang, untuk memperkuat integrasi ekosistem agen

Belum ada komentar.

Belum ada komentar.