Semua proyek AI pada akhirnya menjadi agen

(allen.hutchison.org)

10 poin oleh GN⁺ 2026-01-16 | Belum ada komentar. | Bagikan ke WhatsApp

Dalam perjalanan proyek, pola perkembangan dari sekadar menulis skrip menjadi membangun agen AI otonom terus berulang
Ketika alat-alat yang sedang dikembangkan diberi hak akses ke tool, model percakapan sederhana berubah menjadi agen yang bisa merencanakan, mengeksekusi, dan mengulang
Logika berbasis classifier atau conditional pada akhirnya digantikan oleh arsitektur agen, dan struktur sederhana yang berpusat pada pemanggilan tool yang dipilih model lebih fleksibel dan kuat
Peran manusia bergeser dari Human-in-the-Loop ke Human-on-the-Loop, dan tugas utama menjadi menetapkan tujuan serta guardrail
Yang lebih penting daripada kompleksitas kode adalah pengelolaan kepercayaan dan penilaian, dan agen menjadi sistem yang tumbuh bersama developer

Konvergensi dari skrip sederhana ke agen

Sebagian besar proyek AI yang dikerjakan sepanjang 2025 pada akhirnya bermuara pada bentuk agen
Skrip sederhana dengan struktur input-proses-output berkembang menjadi agen dengan menambahkan loop berulang, kumpulan tool, dan parsing JSON
Definisi agen menurut penulis: model yang berjalan melalui loop dalam keadaan memiliki akses ke tool
Artinya, jika diberi cukup waktu, semua proyek AI akan berkonvergensi menjadi agen

Melampaui fungsi otomatisasi sederhana, software bergerak ke tahap di mana ia menilai dan mengeksekusi sendiri seperti ‘intern digital’
- Gemini Scribe awalnya hanyalah plugin chat sederhana untuk Obsidian, tetapi setelah diberi akses ke tool read_file, ia mulai mengelola konteks dan menjalankan tugas sendiri
- Pengguna tidak lagi perlu mengelola input model secara manual, dan cukup memberi perintah tingkat instruksi seperti “baca notulen rapat dan ringkas”
Perubahan ini berarti pergeseran dari percakapan ke delegasi, dengan agen mengambil alih perencanaan, eksekusi, dan iterasi

Dalam proses pengembangan Gemini CLI, model juga berkembang dari sekadar generator kode menjadi eksekutor otonom dengan memanfaatkan tool eksekusi perintah
- Model membentuk loop yang menjalankan test, mendeteksi kegagalan, lalu memperbaiki sendiri dan menjalankannya ulang
Dalam proses ini, masalah keamanan dan kepercayaan menjadi menonjol, sehingga dibutuhkan sistem kebijakan pemisahan izin seperti file sudoers
- Skrip sederhana tidak memerlukan policy engine, tetapi agen wajib memiliki guardrail untuk mencegah kesalahan penilaian

Dalam proyek Podcast RAG, penulis membuat classifier AI yang mengelompokkan target pencarian berdasarkan pertanyaan pengguna, tetapi batasannya kemudian terlihat
- Logika klasifikasi tidak sepenuhnya mencerminkan niat pengguna, dan membatasi dengan kode penilaian yang sebenarnya sudah bisa dilakukan model dengan baik
Solusinya adalah menghapus classifier dan memberikan dua tool, search_descriptions dan search_episodes, kepada agen
- Agen memilih dan menggunakan tool secara paralel sesuai situasi, sehingga pencarian menjadi lebih fleksibel
Di Gemini Scribe juga, logika prediksi konteks yang kompleks dihapus dan disederhanakan menjadi struktur pemanggilan tool yang membaca file saat diperlukan
Penulis mengajukan patokan pengembangan: “Jika Anda menentukan apa yang harus dilakukan AI dengan if/else, berarti Anda sebenarnya sudah sedang membuat agen”

Peran manusia bergeser dari struktur yang menyetujui setiap tahap menjadi peran pengawas yang hanya menetapkan tujuan dan batasan
- Karena agen bekerja tanpa intervensi manusia yang terus-menerus, definisi tujuan, batasan, dan penanganan pengecualian yang jelas menjadi wajib
Tanpa guardrail yang tepat, agen juga berisiko terjebak menunggu input atau masuk ke jalur yang tidak produktif
Manusia bukan lagi pelaksana, melainkan pengawas dan penetap batas yang mengelola arah sistem

Membangun agen tidak sesulit yang terlihat, dan justru bisa disederhanakan dengan menghapus percabangan kondisi dan logika penanganan pengecualian
- Karena model menilai sesuai situasi, logika prediksi di muka menjadi tidak perlu
Kompleksitas yang sebenarnya bukan ada pada kode, melainkan pada delegasi kepercayaan dan penilaian
- Developer harus lebih fokus pada desain untuk mencegah kesalahan penilaian daripada error sintaks
Berbeda dari skrip statis, agen adalah sistem yang berevolusi mengikuti permintaan pengguna dan mencari cara yang lebih baik
Saat Anda mulai ingin menambahkan definisi tool ke skrip sederhana, itu berarti Anda sudah memasuki tahap membangun agen