- Semua pekerjaan dapat dipandang sebagai kumpulan tugas yang dibagi antara manusia dan mesin
- Perangkat lunak menangani semakin banyak tugas, tetapi sebagian besar proses bisnis masih dimiliki manusia
- AI agent diharapkan akan mengubah keseimbangan kerja ini secara menentukan
- Berbeda dari generasi perangkat lunak sebelumnya, AI agent dapat mengotomatiskan proses end-to-end secara dinamis melalui arsitektur kognitif baru
- Ini bukan sekadar AI yang bisa membaca dan menulis, melainkan AI yang dapat menentukan alur logika aplikasi dan bertindak atas nama pengguna, serta merepresentasikan peluang terbesar LLM di enterprise
Bukankah ini cuma RPA? : Batasan dan masalah RPA
- Ini mungkin terdengar familiar karena UiPath dan Zapier telah menjual visi serupa selama 10 tahun terakhir dengan nama "bot automation"
- UiPath, raksasa RPA, mengotomatiskan proses seperti mengekstrak informasi dari dokumen, memindahkan folder, mengisi formulir, dan memperbarui database dengan merekam perilaku pengguna serta meniru langkah-langkah berurutan melalui screen scraping dan otomasi GUI
- Setelah itu, penyedia iPaaS seperti Zapier memperkenalkan pendekatan "API automation" yang lebih ringan, tetapi tidak seperti UiPath, cakupannya terbatas pada otomasi web app
- UiPath dan Zapier membuktikan adanya pasar untuk platform otomasi horizontal berbasis aturan yang dapat dikomposisikan guna menangani long tail dari proses enterprise yang ada di dalam dan di antara sistem perangkat lunak spesifik departemen atau industri
- Namun, ketika enterprise memperluas otomasi berbasis bot, kesenjangan antara kemampuan arsitektur lama dan otonomi yang dijanjikan mulai terlihat
- Masih membutuhkan banyak tenaga kerja dan pekerjaan manual. Proses membangun dan memelihara otomasi tetap sangat manual dan menyakitkan
- Otomasi UI rapuh atau integrasi API terbatas. Otomasi UI sering rusak ketika UI perangkat lunak berubah, dan API memang lebih stabil, tetapi jauh lebih sedikit integrasinya dengan perangkat lunak legacy atau on-premise
- Tidak dapat menangani data tidak terstruktur. Sebanyak 80% data enterprise bersifat tidak terstruktur atau semi-terstruktur, tetapi otomasi berbasis urutan tidak dapat bekerja secara cerdas dengan data ini
- Solusi RPA dan iPaaS yang ada tetap dibelenggu arsitektur deterministik, bahkan saat mencoba mengintegrasikan LLM
- Autopilot milik UiPath dan AI Actions milik Zapier hanya menyediakan LLM untuk pola desain sub-agent seperti text-to-action atau node untuk pencarian semantik, sintesis, dan one-shot generation
- Kemampuan AI ini bisa sangat kuat, tetapi masih melewatkan use case LLM yang lebih transformatif dalam otomasi proses
AI agent pada dasarnya berbeda sebagai mesin pengambilan keputusan
- Tidak seperti bot RPA atau aplikasi RAG saat ini, agent menempati pusat alur kontrol aplikasi sebagai mesin pengambilan keputusan
- Untuk pertama kalinya, ini memungkinkan adaptabilitas, tindakan multi-langkah, penalaran kompleks, dan penanganan pengecualian yang kuat
- Untuk menjelaskan maksudnya, ambil contoh Invoice Reconciliation: dalam diagram proses yang disederhanakan untuk mencocokkan PDF invoice baru dengan general ledger perusahaan, kompleksitas workflow dengan cepat menjadi sulit ditangani
- Bahkan dalam tiga kelompok keputusan pertama saja, hampir mustahil mempertimbangkan semua situasi pengecualian yang relevan
- Bot RPA yang menjalankan workflow ini secara mekanis sering kali gagal lalu mengeskalasikan kecocokan parsial atau item yang hilang kepada manusia
- Namun, saat agent diterapkan pada workflow yang sama, performanya jauh lebih unggul
- Beradaptasi dengan situasi baru: berdasarkan penalaran dasar dan konteks bisnis yang relevan, agent dapat secara cerdas mengenali dan menyesuaikan diri dengan sumber data baru, format invoice, konvensi penamaan, nomor akun, perubahan kebijakan, dan sebagainya
- Mampu melakukan tugas multi-langkah: misalnya, jika jumlah invoice tidak cocok, agent dapat melakukan investigasi multi-langkah seperti memeriksa email terbaru vendor untuk mengonfirmasi kemungkinan perubahan harga
- Menunjukkan penalaran kompleks: jika invoice dari vendor internasional harus direkonsiliasi dengan ledger, berbagai pertimbangan seperti mata uang invoice, mata uang ledger, tanggal transaksi, fluktuasi nilai tukar, biaya lintas negara, dan biaya bank harus dicari dan dihitung bersama. Agent dapat melakukan kecerdasan seperti ini, sedangkan bot RPA kemungkinan akan mengeskalasikannya ke manusia
- Mempertimbangkan ketidakpastian: untuk pengecualian seperti kesalahan pembulatan pada item individual atau angka yang tidak terbaca, agent dapat menanganinya dengan kuat berdasarkan konteks seperti kecocokan total nilai pesanan, waktu invoice sebelumnya, dan frekuensinya
Peta lanskap pasar AI agent
- AI agent bukan lagi fiksi ilmiah. Dari startup hingga perusahaan Fortune 500, sistem seperti ini sudah dibeli dan digunakan dalam skala besar
- Saat ini, pasar agent dapat divisualisasikan melalui dua dimensi utama: spesifisitas domain dan otonomi LLM
- Spesifisitas domain: mulai dari agent terspesialisasi untuk industri vertikal atau departemen seperti kesehatan atau customer support, hingga platform agent horizontal dengan fungsi yang luas dan umum
- Otonomi LLM: menunjukkan sejauh mana language model dapat secara mandiri merencanakan dan mengarahkan logika aplikasi
- Di kanan atas peta pasar terdapat agent yang paling horizontal dan paling dapat digeneralisasi
- Enterprise agent: platform yang dapat diskalakan untuk membangun dan mengelola agent lintas berbagai fungsi dan workflow melalui SOP berbahasa natural atau aturan yang mirip dengan yang diberikan kepada karyawan baru. Sebagian besar menggunakan arsitektur "agent on rails", yang mengharuskan setiap proses baru didasarkan pada serangkaian tugas, konteks bisnis, dan guardrail yang telah ditentukan sebelumnya
- Browser agent: mengikuti desain "general AI agent" yang memanfaatkan vision transformer yang dilatih pada berbagai antarmuka perangkat lunak dan codebase dasar untuk mengotomatiskan penelusuran web, tugas UI visual, input teks, dan sebagainya. Pendekatan ini cenderung memperoleh kemampuan generalisasi dengan mengorbankan konsistensi
- Layanan berbasis AI: karena desain "agent on rails" membutuhkan infrastruktur data dan guardrail yang luas agar benar-benar berjalan, perusahaan seperti Distyl dan Agnetic menyediakan layanan engineering forward-deployed untuk menjembatani kesenjangan dengan pelanggan melalui model "Palantir for AI"
- Namun, tidak semua agent bertujuan menjadi horizontal dan dapat digeneralisasi. Semakin banyak agent spesifik domain dan workflow yang meningkatkan keandalan dengan membatasi jenis masalah
- Vertical agent: peluang paling menjanjikan ada pada proses manual dan berorientasi prosedur yang ditangani manusia berdasarkan SOP atau aturan. Kategori representatifnya meliputi customer support, rekrutmen, tugas software development seperti code review/testing/maintenance, cold sales, dan security operations
- AI assistant: cara lain mempersempit fokus agent melalui spesifisitas tugas alih-alih spesifisitas domain. Tidak seperti enterprise dan vertical agent yang menangani proses end-to-end yang kompleks, AI assistant menjalankan tugas yang lebih sederhana dan berfokus pada produktivitas
- Meski bukan agent itu sendiri, solusi AI generatif yang dibangun di sekitar arsitektur RAG terkadang juga bersaing memperebutkan anggaran dan workflow yang sama dengan solusi berbasis agent
- Vertical AI: platform otomasi kesehatan Tennr memproses referral dengan mengekstrak data tidak terstruktur dari berbagai sumber seperti fax, PDF, dan telepon, lalu memasukkannya ke EHR klinik, sehingga menghilangkan kebutuhan input manual oleh staf
- RAG-as-a-Service: perusahaan seperti Danswer dan Gradient memungkinkan pelanggan mengkueri sumber data tidak terstruktur seperti PDF dan mengekstrak data untuk dimasukkan ke database atau sistem yang lebih terstruktur
- Enterprise search: Glean, Perplexity, dan Sana menyediakan kueri semantik untuk mengelola pengetahuan di seluruh organisasi dengan lebih baik dan membongkar data silo melalui pengindeksan serta pencarian dokumen yang relevan secara konseptual
Otomatisasi enterprise di masa depan
- Gelombang kedua AI generatif akan didefinisikan bukan sekadar oleh kemampuan membaca dan menulis, tetapi oleh agent yang dapat berpikir dan bertindak atas nama pengguna
- Seiring arsitektur ini makin matang, agent akan menjadi katalis kuat bagi penaklukan ekonomi layanan oleh AI
Belum ada komentar.