Setengah pasar agen AI dikuasai satu bidang, sisanya masih merupakan wilayah yang belum tergarap

(garryslist.org)

18 poin oleh GN⁺ 2026-02-23 | Belum ada komentar. | Bagikan ke WhatsApp

Rekayasa perangkat lunak menyumbang sekitar 50% dari seluruh pemanggilan alat agen AI, sementara 16 vertikal seperti layanan kesehatan, hukum, dan keuangan masing-masing masih di bawah 5%
Kapabilitas nyata model AI sudah berada pada tingkat yang mampu menangani pekerjaan yang membutuhkan 5 jam bagi manusia, tetapi dalam penggunaan sebenarnya, sesi pada persentil ke-99,9 hanya bertahan sekitar 42 menit, menunjukkan kesenjangan besar antara kemampuan dan kepercayaan
Seiring akumulasi pengalaman pengguna, tingkat persetujuan otomatis naik dari 20% menjadi lebih dari 40%, dan pada saat yang sama pengguna mahir mengalihkan strategi pengawasan dari persetujuan awal ke pemantauan aktif
Inti dari vertical AI adalah integrasi data proprietari, context engineering yang spesifik domain, dan change management pelanggan, yang menjadi pembeda antara wrapper sederhana dan perusahaan yang defensible
Seperti SaaS yang telah melahirkan lebih dari 170 unicorn selama beberapa dekade terakhir, ada kemungkinan muncul unicorn vertical AI yang berpadanan dengan tiap unicorn SaaS, dan versi AI ini dapat menggantikan bukan hanya perangkat lunak tetapi juga operator

Rekayasa perangkat lunak menguasai setengah aktivitas agen AI

Menurut studi penggunaan nyata agen AI yang dipublikasikan Anthropic, rekayasa perangkat lunak mencakup 49,7% dari seluruh pemanggilan alat agentic
Layanan kesehatan hanya 1%, hukum 0,9%, pendidikan 1,8%, dan tidak ada bidang di antara 16 vertikal yang melampaui 9%
Ini bukan berarti pasar sudah jenuh, melainkan masih belum benar-benar terbentuk
Han Wang menyebutnya sebagai peluang greenfield yang diabaikan kebanyakan pendiri
Penulis artikel ini, Garry Tan, mengatakan bahwa jika ia memulai startup sekarang, ia akan memperhatikan area merah pada grafik ini

Menurut evaluasi METR, model Claude mampu mengerjakan tugas yang membutuhkan 5 jam bagi manusia, tetapi sesi nyata rata-rata hanya berlangsung 42 menit
Kesenjangan antara apa yang dapat dilakukan AI dan apa yang diizinkan pengguna menciptakan peluang besar
Antara Oktober 2025 hingga Januari 2026, durasi giliran pada persentil ke-99,9 hampir dua kali lipat, dari kurang dari 25 menit menjadi lebih dari 45 menit
- Ini mencerminkan bukan hanya peningkatan performa model, tetapi juga akumulasi kepercayaan pengguna di tiap sesi
Dalam data internal, tingkat keberhasilan Claude Code meningkat dua kali lipat, sementara intervensi manusia per sesi turun dari 5,4 menjadi 3,3 kali
Kemampuan model sudah memadai, tetapi deployment belum mampu mengimbanginya, dan ini menciptakan peluang produk baru

Pengguna baru hanya memberi persetujuan otomatis pada 20% sesi Claude Code, tetapi setelah 750 sesi pengalaman, lebih dari 40% beralih ke persetujuan otomatis penuh
Secara kontraintuitif, pengguna mahir bukan lebih jarang campur tangan, melainkan lebih sering — tingkat intervensi pengguna baru 5%, pengguna mahir 9%
- Ini bukan kontradiksi, melainkan perubahan strategi pengawasan: pemula menyetujui tiap langkah di muka, sedangkan pengguna mahir mendelegasikan lalu campur tangan saat masalah muncul (persetujuan awal → pemantauan aktif)
Temuan terkait keselamatan: pada tugas kompleks, Claude Code mengajukan pertanyaan klarifikasi lebih dari dua kali lebih sering daripada frekuensi intervensi manusia
- Ini menunjukkan pola perilaku agen yang tidak asal melaju, tetapi berhenti sendiri saat tidak yakin
Pelajaran utama Anthropic: otonomi yang benar-benar dijalankan agen adalah hasil ko-konstruksi antara model, pengguna, dan produk

Formula pembangunan vertical AI menurut Aaron Levie:
- Memahami data unik, alur kerja, dan hambatan regulasi di tiap industri adalah inti dari perusahaan yang memiliki daya tahan defensif tinggi
- Bukan sekadar wrapper sederhana, tetapi membutuhkan kemampuan integrasi data unik, otomatisasi alur kerja, dan change management
- Membangun perangkat lunak agentic yang terhubung ke data proprietari
- Merancang perangkat lunak agar benar-benar bekerja sesuai manusia dan masalah nyata
- Memaksimalkan kecerdasan output melalui context engineering yang spesifik domain
- Bagian yang dilewatkan kebanyakan pendiri: mendorong change management bagi pelanggan
Alasan vertical AI defensible: siapa pun bisa membuat wrapper, tetapi hanya sedikit yang mampu menavigasi alur kerja spesifik, batasan regulasi, dan friksi organisasi seperti penagihan layanan kesehatan, legal discovery, atau perizinan konstruksi
SaaS tumbuh 10 kali lipat setiap dekade selama beberapa dekade, lebih dari 40% dana VC dalam 20 tahun terakhir mengalir ke SaaS, dan telah melahirkan lebih dari 170 unicorn SaaS
Tesis utamanya: untuk tiap unicorn SaaS akan ada unicorn vertical AI yang setara, dan versi AI ini bisa 10 kali lebih besar karena dapat menggantikan bukan hanya perangkat lunak tetapi juga operator

Temuan inti Anthropic:
- Otonomi bukan sifat bawaan model, melainkan sesuatu yang dibentuk bersama oleh model, pengguna, dan produk
- Karena itu, evaluasi pra-deployment saja tidak cukup untuk menangkapnya, sehingga pengukuran di lingkungan nyata menjadi penting
Angka keselamatan: manusia campur tangan pada 73% pemanggilan alat, dan hanya 0,8% yang diklasifikasikan sebagai tindakan yang tidak dapat dibatalkan
- Deployment paling berisiko seperti kebocoran API key atau perdagangan kripto otonom umumnya masih berupa evaluasi keamanan, bukan penggunaan produksi nyata
Kebijakan “setujui semua tindakan” hanya menghambat produktivitas tanpa meningkatkan keselamatan,
tujuan kebijakan yang lebih baik adalah memastikan manusia dapat memantau dan campur tangan bila diperlukan

Rekayasa perangkat lunak sudah relatif lebih dulu dikuasai, sementara layanan kesehatan, hukum, keuangan, pendidikan, layanan pelanggan, logistik, dan lainnya
16 vertikal dengan pangsa pasar satu digit masih menunggu pihak yang dapat menanamkan keahlian domain ke dalam agen
Sebelumnya lahir 300 unicorn SaaS, dan berikutnya akan muncul 300 unicorn vertical AI
Pendiri yang memilih vertikal, menanamkan keahlian domain ke dalam agen, dan menyelesaikan change management akan memiliki perangkat lunak enterprise dekade berikutnya
Model sudah mampu bekerja selama 5 jam, tetapi pengguna baru mengizinkan 42 menit
- Ini menunjukkan bahwa kita masih berada pada tahap awal pemanfaatan AI,
- dan bahwa masih ada banyak bidang yang bahkan belum menerima satu menit pun kecerdasan