- Dalam perjalanan proyek, pola perkembangan dari sekadar menulis skrip menjadi membangun agen AI otonom terus berulang
- Ketika alat-alat yang sedang dikembangkan diberi hak akses ke tool, model percakapan sederhana berubah menjadi agen yang bisa merencanakan, mengeksekusi, dan mengulang
- Logika berbasis classifier atau conditional pada akhirnya digantikan oleh arsitektur agen, dan struktur sederhana yang berpusat pada pemanggilan tool yang dipilih model lebih fleksibel dan kuat
- Peran manusia bergeser dari Human-in-the-Loop ke Human-on-the-Loop, dan tugas utama menjadi menetapkan tujuan serta guardrail
- Yang lebih penting daripada kompleksitas kode adalah pengelolaan kepercayaan dan penilaian, dan agen menjadi sistem yang tumbuh bersama developer
Konvergensi dari skrip sederhana ke agen
- Sebagian besar proyek AI yang dikerjakan sepanjang 2025 pada akhirnya bermuara pada bentuk agen
- Skrip sederhana dengan struktur input-proses-output berkembang menjadi agen dengan menambahkan loop berulang, kumpulan tool, dan parsing JSON
- Definisi agen menurut penulis: model yang berjalan melalui loop dalam keadaan memiliki akses ke tool
- Artinya, jika diberi cukup waktu, semua proyek AI akan berkonvergensi menjadi agen
Tarikan gravitasi menuju otonomi
- Melampaui fungsi otomatisasi sederhana, software bergerak ke tahap di mana ia menilai dan mengeksekusi sendiri seperti ‘intern digital’
- Gemini Scribe awalnya hanyalah plugin chat sederhana untuk Obsidian, tetapi setelah diberi akses ke tool
read_file, ia mulai mengelola konteks dan menjalankan tugas sendiri
- Pengguna tidak lagi perlu mengelola input model secara manual, dan cukup memberi perintah tingkat instruksi seperti “baca notulen rapat dan ringkas”
- Perubahan ini berarti pergeseran dari percakapan ke delegasi, dengan agen mengambil alih perencanaan, eksekusi, dan iterasi
Dari skrip ke Sudoers
- Dalam proses pengembangan Gemini CLI, model juga berkembang dari sekadar generator kode menjadi eksekutor otonom dengan memanfaatkan tool eksekusi perintah
- Model membentuk loop yang menjalankan test, mendeteksi kegagalan, lalu memperbaiki sendiri dan menjalankannya ulang
- Dalam proses ini, masalah keamanan dan kepercayaan menjadi menonjol, sehingga dibutuhkan sistem kebijakan pemisahan izin seperti file
sudoers
- Skrip sederhana tidak memerlukan policy engine, tetapi agen wajib memiliki guardrail untuk mencegah kesalahan penilaian
Agen yang tadinya ingin menjadi classifier
- Dalam proyek Podcast RAG, penulis membuat classifier AI yang mengelompokkan target pencarian berdasarkan pertanyaan pengguna, tetapi batasannya kemudian terlihat
- Logika klasifikasi tidak sepenuhnya mencerminkan niat pengguna, dan membatasi dengan kode penilaian yang sebenarnya sudah bisa dilakukan model dengan baik
- Solusinya adalah menghapus classifier dan memberikan dua tool,
search_descriptions dan search_episodes, kepada agen
- Agen memilih dan menggunakan tool secara paralel sesuai situasi, sehingga pencarian menjadi lebih fleksibel
- Di Gemini Scribe juga, logika prediksi konteks yang kompleks dihapus dan disederhanakan menjadi struktur pemanggilan tool yang membaca file saat diperlukan
- Penulis mengajukan patokan pengembangan: “Jika Anda menentukan apa yang harus dilakukan AI dengan if/else, berarti Anda sebenarnya sudah sedang membuat agen”
Pergeseran ke Human-on-the-Loop
- Peran manusia bergeser dari struktur yang menyetujui setiap tahap menjadi peran pengawas yang hanya menetapkan tujuan dan batasan
- Karena agen bekerja tanpa intervensi manusia yang terus-menerus, definisi tujuan, batasan, dan penanganan pengecualian yang jelas menjadi wajib
- Tanpa guardrail yang tepat, agen juga berisiko terjebak menunggu input atau masuk ke jalur yang tidak produktif
- Manusia bukan lagi pelaksana, melainkan pengawas dan penetap batas yang mengelola arah sistem
Menerima kompleksitas
- Membangun agen tidak sesulit yang terlihat, dan justru bisa disederhanakan dengan menghapus percabangan kondisi dan logika penanganan pengecualian
- Karena model menilai sesuai situasi, logika prediksi di muka menjadi tidak perlu
- Kompleksitas yang sebenarnya bukan ada pada kode, melainkan pada delegasi kepercayaan dan penilaian
- Developer harus lebih fokus pada desain untuk mencegah kesalahan penilaian daripada error sintaks
- Berbeda dari skrip statis, agen adalah sistem yang berevolusi mengikuti permintaan pengguna dan mencari cara yang lebih baik
- Saat Anda mulai ingin menambahkan definisi tool ke skrip sederhana, itu berarti Anda sudah memasuki tahap membangun agen
Belum ada komentar.