Seberapa otonom sebenarnya AI agent bekerja
- Anthropic menganalisis jutaan interaksi Claude Code untuk mengukur seberapa banyak pekerjaan yang benar-benar dipercayakan kepada AI agent.
- Inti riset ini bukan performa model, melainkan sejauh mana manusia mendelegasikan otonomi.
- Sebagian besar tugas berdurasi singkat, tetapi durasi kerja otonom terpanjang meningkat dari 25 menit menjadi lebih dari 45 menit dalam rentang 3 bulan.
- Hal yang menarik adalah perubahan ini berasal dari akumulasi kepercayaan pengguna, bukan dari upgrade model.
- Pengguna berpengalaman mengubah strategi pengawasan menjadi pendekatan monitoring yang menaikkan tingkat persetujuan otomatis sambil tetap campur tangan di tengah proses saat diperlukan.
- Selain itu, AI sendiri juga menunjukkan mekanisme kendali diri dengan bertanya atau berhenti saat merasa tidak pasti.
- Saat ini, setengah dari penggunaan agent terfokus pada ranah pengembangan perangkat lunak.
- Pada akhirnya, otonomi AI agent ditentukan bukan oleh performa model, melainkan oleh kepercayaan, budaya organisasi, dan struktur alat.
1 komentar
Tunggu sebentar!<ctrl+ enter>