5 poin oleh GN⁺ 2 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Akhir era perangkat lunak adalah awal era harness, ketika SaaS yang berjalan dengan workflow tetap dan database terkelola sedang digantikan oleh AI yang memiliki kecerdasan
  • AI itu kuat, tetapi seperti kuda liar yang belum dijinakkan; untuk memanfaatkan kekuatannya diperlukan pengendalian yang sistematis (domestication)
  • Harness agen AI didefinisikan sebagai 7 komponen inti yang mengelilingi LLM di pusat, dan tiap elemen menentukan keandalan serta performa tingkat produksi
  • Di era ketika semua perusahaan bisa mengakses model yang sama, pemenangnya bukan model itu sendiri melainkan pihak yang merancang dan mengoperasikan harness dengan lebih baik (best rider)
  • Ribuan pasar yang terpisah dan tidak diprioritaskan oleh lab besar tetap menjadi peluang bagi startup

Makna era harness

  • AI mendefinisikan ulang paradigma perangkat lunak dengan menggantikan SaaS berbasis workflow tetap dan database terkelola dengan kecerdasan (intelligence)
  • AI dianalogikan sebagai mustang (kuda liar): kuat tetapi kasar, sehingga tidak bisa langsung digunakan, dan proses menjinakkannya itulah harness
  • Inti dari penjinakan ini adalah arsitektur yang menempatkan LLM di pusat, dengan 7 komponen tersusun secara radial di sekelilingnya

7 komponen harness agen AI

  • 1. Context & Memory (Konteks dan Memori)

    • Model umum memerlukan retrieval yang disesuaikan dengan kebutuhan (bespoke retrieval), dan sistem pencarian konteks untuk radiolog tidak bisa sama dengan sistem untuk asisten hukum
    • Sistemnya berbeda-beda bergantung pada kasus, mulai dari memori jangka pendek ("apa yang dilakukan agen 45 detik lalu"), pencarian gambar skala besar (radiologi/generasi gambar), hingga pencarian kata kunci di miliaran dokumen
    • Di samping retrieval ada database konteks, yang berperan sebagai "buku resep" berisi cara bisnis benar-benar dijalankan
      • SOP yang dibawa orang di kepala mereka saat datang bekerja itulah resep tersebut
      • Esensi database konteks adalah penangkapan awal dan evolusinya seiring perubahan manusia maupun proses
  • 2. Tools & Action (Alat dan Tindakan)

    • Alat adalah sarana agen untuk memengaruhi dunia luar; jika resep dalam database konteks menjelaskan "apa yang harus dilakukan", maka alat adalah bahan dan instrumen untuk benar-benar melakukannya
    • Harness modern mengekspos alat melalui registry, memvalidasi argumen yang dikirim model, mendispatch pemanggilan, melewatkan pekerjaan sensitif melalui gerbang persetujuan, lalu mem-parsing hasilnya kembali ke loop agen
    • MCP muncul sebagai connective tissue untuk menghubungkan alat
    • Kualitas harness ditentukan oleh jumlah alat yang bisa diekspos dengan aman dan kemampuan menangani kegagalan secara rapi
  • 3. Orchestration & Loop (Orkestrasi dan Loop)

    • Loop agen memiliki struktur think → act → observe → repeat
    • Perencanaan, pemecahan tugas, sub-agen, retry, dan kondisi penghentian menentukan cara pekerjaan dijalankan
    • Sistem harus membaik seiring penggunaan, dan pola closed loop yang belajar dari tiap eksekusi menjadi faktor pembeda antvendor
  • 4. State & Persistence (Status dan Persistensi)

    • Dalam enterprise skala besar, ketika banyak orang menggunakan sistem secara bersamaan, resiliensi adalah keharusan
    • Jika harness crash pada langkah ke-7 dari pekerjaan 10 langkah, sistem harus melanjutkan dari langkah ke-8, bukan mengulang dari awal
    • File system, checkpoint, session thread, dan artifact store adalah mekanisme yang mencegah hilangnya pekerjaan
  • 5. Sandbox & Compute (Sandbox dan Komputasi)

    • Setiap agen membutuhkan ruang kerja terpisah (sandbox)
    • Workspace Unix yang terisolasi, egress jaringan yang terkontrol, serta credentials yang disimpan di luar model menjamin keamanan, kerahasiaan, dan kecepatan dalam skala besar
  • 6. Observability & Governance (Observabilitas dan Tata Kelola)

    • "Apa yang tidak bisa dilihat tidak bisa dipercaya" — pelacakan setiap langkah, logging setiap pemanggilan alat, menjalankan evals sebagai regression test, dan human-in-the-loop untuk keputusan berisiko tinggi adalah hal yang mengubah demo menjadi sistem produksi
    • Guardrails menegakkan kebijakan, dan Evals menangkap regresi sebelum pelanggan mengalaminya
  • 7. Cost & Workflow Optimization (Biaya dan Optimisasi Workflow)

    • Yang ketujuh adalah penilaian arsitektural (architectural judgment)
    • Ini mencakup membedakan area yang harus diproses secara deterministik vs non-deterministik, memilih model yang tepat untuk tiap tahap (terdepan, menengah, kecil, fine-tuned), dan memutuskan apakah pengetahuan sebaiknya ditempatkan dalam skill atau memori

Peta persaingan yang baru

  • Hasilnya adalah dinamika persaingan baru dalam perangkat lunak, dan ini tidak berlaku sama untuk semua kategori
  • Pasar yang diprioritaskan oleh major lab (lembaga riset AI utama) diuntungkan oleh eksekusi cepat dan kontrol langsung atas model
  • Namun, ribuan pasar terpisah lainnya tetap terbuka bagi startup
  • Di era ketika semua perusahaan dapat menggunakan model yang sama, "penunggang terbaik (best riders)" yang menang — yaitu kemampuan merancang dan mengoperasikan harness menjadi daya saing utama

Belum ada komentar.

Belum ada komentar.