Perangkat Lunak Setelah AI: Dimulainya Era Harness
(tomtunguz.com)- Akhir era perangkat lunak adalah awal era harness, ketika SaaS yang berjalan dengan workflow tetap dan database terkelola sedang digantikan oleh AI yang memiliki kecerdasan
- AI itu kuat, tetapi seperti kuda liar yang belum dijinakkan; untuk memanfaatkan kekuatannya diperlukan pengendalian yang sistematis (domestication)
- Harness agen AI didefinisikan sebagai 7 komponen inti yang mengelilingi LLM di pusat, dan tiap elemen menentukan keandalan serta performa tingkat produksi
- Di era ketika semua perusahaan bisa mengakses model yang sama, pemenangnya bukan model itu sendiri melainkan pihak yang merancang dan mengoperasikan harness dengan lebih baik (best rider)
- Ribuan pasar yang terpisah dan tidak diprioritaskan oleh lab besar tetap menjadi peluang bagi startup
Makna era harness
- AI mendefinisikan ulang paradigma perangkat lunak dengan menggantikan SaaS berbasis workflow tetap dan database terkelola dengan kecerdasan (intelligence)
- AI dianalogikan sebagai mustang (kuda liar): kuat tetapi kasar, sehingga tidak bisa langsung digunakan, dan proses menjinakkannya itulah harness
- Inti dari penjinakan ini adalah arsitektur yang menempatkan LLM di pusat, dengan 7 komponen tersusun secara radial di sekelilingnya
7 komponen harness agen AI
-
1. Context & Memory (Konteks dan Memori)
- Model umum memerlukan retrieval yang disesuaikan dengan kebutuhan (bespoke retrieval), dan sistem pencarian konteks untuk radiolog tidak bisa sama dengan sistem untuk asisten hukum
- Sistemnya berbeda-beda bergantung pada kasus, mulai dari memori jangka pendek ("apa yang dilakukan agen 45 detik lalu"), pencarian gambar skala besar (radiologi/generasi gambar), hingga pencarian kata kunci di miliaran dokumen
- Di samping retrieval ada database konteks, yang berperan sebagai "buku resep" berisi cara bisnis benar-benar dijalankan
- SOP yang dibawa orang di kepala mereka saat datang bekerja itulah resep tersebut
- Esensi database konteks adalah penangkapan awal dan evolusinya seiring perubahan manusia maupun proses
-
2. Tools & Action (Alat dan Tindakan)
- Alat adalah sarana agen untuk memengaruhi dunia luar; jika resep dalam database konteks menjelaskan "apa yang harus dilakukan", maka alat adalah bahan dan instrumen untuk benar-benar melakukannya
- Harness modern mengekspos alat melalui registry, memvalidasi argumen yang dikirim model, mendispatch pemanggilan, melewatkan pekerjaan sensitif melalui gerbang persetujuan, lalu mem-parsing hasilnya kembali ke loop agen
- MCP muncul sebagai connective tissue untuk menghubungkan alat
- Kualitas harness ditentukan oleh jumlah alat yang bisa diekspos dengan aman dan kemampuan menangani kegagalan secara rapi
-
3. Orchestration & Loop (Orkestrasi dan Loop)
- Loop agen memiliki struktur think → act → observe → repeat
- Perencanaan, pemecahan tugas, sub-agen, retry, dan kondisi penghentian menentukan cara pekerjaan dijalankan
- Sistem harus membaik seiring penggunaan, dan pola closed loop yang belajar dari tiap eksekusi menjadi faktor pembeda antvendor
-
4. State & Persistence (Status dan Persistensi)
- Dalam enterprise skala besar, ketika banyak orang menggunakan sistem secara bersamaan, resiliensi adalah keharusan
- Jika harness crash pada langkah ke-7 dari pekerjaan 10 langkah, sistem harus melanjutkan dari langkah ke-8, bukan mengulang dari awal
- File system, checkpoint, session thread, dan artifact store adalah mekanisme yang mencegah hilangnya pekerjaan
-
5. Sandbox & Compute (Sandbox dan Komputasi)
- Setiap agen membutuhkan ruang kerja terpisah (sandbox)
- Workspace Unix yang terisolasi, egress jaringan yang terkontrol, serta credentials yang disimpan di luar model menjamin keamanan, kerahasiaan, dan kecepatan dalam skala besar
-
6. Observability & Governance (Observabilitas dan Tata Kelola)
- "Apa yang tidak bisa dilihat tidak bisa dipercaya" — pelacakan setiap langkah, logging setiap pemanggilan alat, menjalankan evals sebagai regression test, dan human-in-the-loop untuk keputusan berisiko tinggi adalah hal yang mengubah demo menjadi sistem produksi
- Guardrails menegakkan kebijakan, dan Evals menangkap regresi sebelum pelanggan mengalaminya
-
7. Cost & Workflow Optimization (Biaya dan Optimisasi Workflow)
- Yang ketujuh adalah penilaian arsitektural (architectural judgment)
- Ini mencakup membedakan area yang harus diproses secara deterministik vs non-deterministik, memilih model yang tepat untuk tiap tahap (terdepan, menengah, kecil, fine-tuned), dan memutuskan apakah pengetahuan sebaiknya ditempatkan dalam skill atau memori
Peta persaingan yang baru
- Hasilnya adalah dinamika persaingan baru dalam perangkat lunak, dan ini tidak berlaku sama untuk semua kategori
- Pasar yang diprioritaskan oleh major lab (lembaga riset AI utama) diuntungkan oleh eksekusi cepat dan kontrol langsung atas model
- Namun, ribuan pasar terpisah lainnya tetap terbuka bagi startup
- Di era ketika semua perusahaan dapat menggunakan model yang sama, "penunggang terbaik (best riders)" yang menang — yaitu kemampuan merancang dan mengoperasikan harness menjadi daya saing utama
Belum ada komentar.