2 poin oleh ragingwind 19 jam lalu | 2 komentar | Bagikan ke WhatsApp

‘Pajak orkestrasi’ di era agen AI dan bottleneck perhatian manusia

Tulisan Addy Osmani membahas masalah bahwa menjalankan banyak agen AI secara bersamaan belum tentu langsung menghasilkan peningkatan produktivitas nyata. Agen bisa bergerak secara paralel, tetapi penilaian manusia untuk memahami, meninjau, dan menggabungkan hasilnya tidak bisa diparalelkan. Penulis menyebut biaya ini sebagai ‘pajak orkestrasi’. Maksudnya adalah biaya tersembunyi yang timbul untuk mengoordinasikan banyak alur kerja. Jika dilihat dari sudut pandang delegasi, ini juga bisa dibaca sebagai gagasan bahwa yang penting bukan mendelegasikan sebanyak mungkin, melainkan hanya sebanyak yang masih bisa ditinjau dengan benar.

  • Argumen utama

    • Memulai agen AI itu mudah, tetapi memeriksa hasilnya dan menyelaraskannya dengan perubahan lain bukan hal yang mudah.
    • Menjalankan banyak agen tidak berarti tercipta “lebih banyak diri kita”; penilaian dan penggabungan pada akhirnya tetap harus melewati perhatian satu orang.
    • Kondisi merasa sibuk dan kondisi benar-benar produktif bisa jadi berbeda.
    • Bahkan jika menjalankan 20 agen, itu tidak serta-merta berarti ada pekerjaan terdistribusi setara 20 agen yang benar-benar siap dirilis.
  • Pajak orkestrasi

    • Penulis melihat biaya mengoordinasikan banyak agen sebagai masalah struktural. Ini bukan sekadar masalah kurang fokus atau kurang latihan, melainkan persoalan desain sistem.
    • Hasil yang dibuat agen pada akhirnya tetap harus ditinjau manusia. Dalam proses ini, isu seperti akurasi, konsistensi dengan arsitektur, dan konflik merge terkumpul pada satu orang.
    • Karena itu, manusia menjadi komponen serial yang lambat di dalam sistem agen AI. Komponen serial berarti bagian yang tidak bisa menangani banyak hal sekaligus dan harus memprosesnya secara berurutan.
  • Analogi teknis

    • Penulis mengibaratkan situasi ini dengan GIL di Python. GIL adalah mekanisme yang membuat banyak thread tetap hanya bisa mengeksekusi satu kode Python pada satu waktu.
    • Artinya, agen bisa berjalan bersamaan, tetapi ketika tiba pada momen yang membutuhkan pemahaman dan penilaian nyata, semuanya harus menunggu satu kunci yang sama, yaitu perhatian manusia.
    • Ia juga mengacu pada prinsip rekayasa kinerja bahwa peningkatan kecepatan dari pemrosesan paralel dibatasi oleh bagian yang tidak bisa diparalelkan. Jadi, meskipun jumlah agen ditambah, jika waktu untuk menilai tidak berkurang, throughput keseluruhan sulit meningkat besar.
  • Kelebihan

    • Agen dapat berguna untuk menangani pekerjaan yang independen di background.
    • Tugas seperti menulis test atau membuat tangkapan layar, yang dapat dibuktikan sampai batas tertentu oleh mesin, bisa mengurangi beban manusia.
    • Penulis menyarankan agar peninjauan hasil dikumpulkan dan diproses sekaligus, sehingga biaya perpindahan konteks karena bolak-balik antarpekerjaan bisa dikurangi.
  • Batasan dan risiko

    • Menambah jumlah agen tidak menambah bandwidth kognitif manusia, yaitu kemampuan untuk memahami dan menilai.
    • Jika agen terlalu sering diperiksa, setiap kali kita harus memanggil kembali konteks pekerjaan yang berbeda, sehingga kelelahan bisa meningkat.
    • Jika peninjauan menjadi dangkal, ada risiko menerima kode buatan agen tanpa benar-benar memahaminya.
    • Jika biaya ini tidak dikelola dengan baik, technical debt dan cognitive debt bisa menumpuk bersamaan. Technical debt adalah beban dalam kode yang sulit diperbaiki di kemudian hari, sedangkan cognitive debt adalah keadaan ketika perubahan terus menumpuk sementara pengembang tidak benar-benar memahami sistemnya.
  • Pembeda

    • Fokus tulisan ini bukan pada performa agen AI itu sendiri, melainkan pada perhatian manusia.
    • Produktivitas seharusnya dilihat bukan dari jumlah agen yang dijalankan, tetapi dari jumlah pekerjaan yang benar-benar ditinjau, digabungkan, dan siap dirilis.
    • Ciri khasnya adalah melihat manusia bukan sebagai pengawas di luar sistem, melainkan sebagai sumber daya terbatas yang termasuk di dalam sistem paralel itu sendiri.
  • Arah praktik

    • Skala penggunaan agen sebaiknya tidak ditentukan oleh sebanyak apa yang muat di layar alat, melainkan oleh kecepatan yang masih bisa Anda review dengan benar.
    • Pekerjaan perlu dipisah. Tugas yang terisolasi bisa diserahkan ke agen background, sedangkan pekerjaan yang penilaiannya sangat penting, seperti bug aneh atau perancangan arsitektur, lebih baik tidak diparalelkan.
    • Perhatian manusia harus dipakai untuk menilai, sementara bagian yang bisa diverifikasi mesin sebaiknya lebih dulu ditunjukkan agen dalam bentuk test atau bukti.
    • Delegasi hanya punya makna yang sangat terbatas pada titik ini. Yang penting bukan kemampuan untuk mendelegasikan lebih banyak, melainkan kemampuan membedakan mana yang boleh didelegasikan dan mana yang harus dinilai langsung.

Tulisan ini menyoroti bahwa bottleneck dalam pemanfaatan agen AI mungkin bukan pada kemampuan eksekusi, melainkan pada kemampuan review dan penilaian. Menjalankan banyak agen memang menjadi lebih mudah, tetapi proses menerima hasilnya secara bertanggung jawab tetap merupakan tugas manusia. Karena itu, produktivitas muncul bukan dari menambah jumlah agen, melainkan dari memperlakukan perhatian kita sebagai sumber daya sistem yang penting dan menata pekerjaan sesuai batas itu. Delegasi pun berada dalam prinsip yang sama. Kuncinya bukan menyerahkan lebih banyak, tetapi menyerahkan pekerjaan dalam batas yang masih bisa dinilai dengan baik.

2 komentar

 
jjpark78 16 jam lalu

Saya juga belakangan merasakan hal yang sama: saat menjalankan 10–20 tugas sekaligus lalu kembali untuk meninjau satu per satu, perpindahan konteksnya tidak berjalan dengan baik, jadi saya sering berpikir, "Ini tadi apa ya??" sambil berusaha mengingat kembali.

 
j2sus91 13 jam lalu

Kalau dikerjakan secara serial, verifikasi dan peninjauan oleh manusia pasti menjadi titik bottleneck.

Pada akhirnya alur kerja harus dialihkan ke pemrosesan paralel oleh agen,
namun kemampuan kognitif manusia ada batasnya.

Pada akhirnya sepertinya kita memasuki era ketika membangun loop verifikasi menjadi kunci kualitas dan pencegahan insiden.
Di sini bukan hanya verifikasi manusia yang penting, tetapi tahap verifikasi juga harus diperkuat dengan saling mengawasi melalui agen.