3 poin oleh GN⁺ 2 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Kekhawatiran bahwa lapisan aplikasi AI akan dilibas oleh lab besar seperti OpenAI dan Anthropic makin meluas di kalangan pendiri startup, tetapi lapisan aplikasi bukan satu peluang tunggal melainkan struktur yang terbagi menjadi "Jalan Bata Kuning (Yellow Brick Road)" dan "Sisa Wilayah Oz (Rest of Oz)"
  • Jalan Bata Kuning adalah wilayah horizontal seperti pembuatan kode, penulisan, dan generasi gambar, di mana kualitas meningkat hanya lewat peningkatan performa model itu sendiri; inilah jalur tempat lab menggelontorkan sumber daya sangat besar
  • Sisa Wilayah Oz adalah area seperti workflow vertikal, multi-tahap, multi-persetujuan, di mana scaffolding di atas model menentukan reliabilitas dan kepatuhan; di sinilah ada peluang bagi startup untuk memiliki hubungan dengan pelanggan
  • Fakta bahwa OpenAI dan Anthropic mengumumkan joint venture forward-deployed berskala besar untuk kustomisasi enterprise sendiri menunjukkan bahwa coworker AI yang digeneralisasi saja tidak bisa menyelesaikan semua masalah
  • Software enterprise generasi berikutnya akan dibangun "di luar jalan" (off the road), dan garis pertahanan utamanya adalah bahwa model bisa diganti, tetapi system of work tidak

Pertanyaan inti dan asumsi

  • Pertanyaan yang berulang kali diterima dari pendiri dan calon karyawan adalah: "Apakah OpenAI dan Anthropic akan mematikan semuanya, dan apakah masih ada yang tersisa untuk dibangun di lapisan aplikasi AI?"
  • Sebagian orang menyimpulkan bahwa satu-satunya tempat untuk menghindari menjadi kelas bawah permanen adalah di dalam lab besar atau di frontier seperti robotika dan hard tech
  • Penulis, dari sudut pandang AI maksimalis, menilai mereka "setengah benar"; memang benar bahwa lab akan menyerap sebagian besar permukaan aplikasi
  • Namun poin kuncinya adalah bahwa lapisan aplikasi bukan satu peluang tunggal — framing yang tepat adalah apakah Anda berada di Jalan Bata Kuning, atau di bagian lain Oz

The Yellow Brick Road — jalan yang ditempuh lab

  • Pola memasang konektor off-the-shelf seperti G Drive, Slack, Salesforce, Notion, dan GitHub ke model berperforma tinggi, lalu menambahkan lapisan orkestrasi agen di atasnya
  • Pola ini berbahaya karena lab sudah melakukan hal yang sama lewat Cowork dan Codex
    • Memiliki model sendiri → margin lebih baik, kontrol lebih besar, dan daya penetapan harga ke hilir
    • Memiliki kebebasan memilih arsitektur yang didefinisikan agar produk berhasil — sejauh ini mereka sengaja mengadopsi pola "model + tool calls", dan ini sangat cocok untuk tugas horizontal tingkat rendah di atas jalan itu
  • Bahkan jika startup mengungguli Codex atau Claude Code dari sisi performa, lab punya jaringan distribusi yang sangat besar dan halo merek terbesar di bidang AI
  • Perusahaan aplikasi AI yang menjalankan playbook ini dengan kombinasi konektor yang sama, tanpa sub-agent atau komposisi, dan tanpa distribusi, sedang menempuh "jalan yang tidak menuju ke mana-mana"

The Rest of Oz — peluang startup

  • Area untuk membangun pengalaman agen di mana model dirangkai melalui jaringan alat, otomasi, dan integrasi yang kompleks, yang pada akhirnya secara alami banyak bermuara pada vertikal
  • Memungkinkan fokus pada tugas multi-tahap dan multi-peserta yang tidak bisa dijangkau platform horizontal
    • Mengumpulkan konteks di seluruh sistem, lalu merutekannya ke banyak orang yang memerlukan persetujuan per tahap
    • Menghubungkan satu atau lebih sistem legacy, membutuhkan hasil deterministik, dan tidak memberi ruang untuk ambiguitas
    • Sering terhubung langsung ke hasil bisnis yang bernilai
  • Lab juga menyadari nilai masalah ini, itulah sebabnya mereka menjalankan outsourced configuration shops sendiri dan mengapa ada kelas upmarket dalam bisnis reinforcement learning

Mengapa Sisa Wilayah Oz tidak akan disapu habis oleh sang penyihir

  • Data and learning flywheels (flywheel data dan pembelajaran)

    • Norma industri implisit, standar yang tidak terdokumentasi, dan tribal knowledge di kepala para praktisi yang tidak ada dalam dataset pelatihan tidak tersedia di web publik
    • Ada dua flywheel yang bekerja secara bertumpuk
      • across-customer: pola yang terakumulasi dari melihat variasi masalah yang sama di banyak pelanggan
      • within-customer: alasan di balik keputusan tertentu, pengecualian implisit, dan aturan praktis khas perusahaan tersebut
    • Perusahaan yang sudah menjalankan 100 legal redline, 1.000 insurance underwriting, atau 10.000 kampanye SDR menginternalisasi bentuk masalah yang tidak bisa direplikasi oleh pendatang baru hanya dengan agen yang baru diluncurkan
    • Alasan utama agen horizontal tidak bisa membangun infrastruktur pembelajaran yang sama adalah UX — hanya pemain vertikal yang bisa merancang permukaan workflow secara tepat
    • Eval set, output berlabel, dan taksonomi edge case terakumulasi sebagai flywheel data spesifik vertikal dan menjadi bahan bakar fine-tuning
  • Managing model variability and complexity (mengelola keragaman dan kompleksitas model)

    • Lab secara internal sudah melakukan routing dan ensemble model per request, tetapi mereka tidak bisa melakukan routing lintas vendor, mengevaluasi model pesaing, atau menerapkan model open-source yang di-fine-tune untuk area sempit
    • Perusahaan Rest of Oz memilih model terbaik untuk tiap sub-tugas bukan hanya dari rilis lab induknya, tetapi dari seluruh pasar model
    • Mereka menyerap "pekerjaan yang tidak ingin dilakukan siapa pun" seperti menjalankan ulang eval setiap upgrade, mengalibrasi ulang prompt untuk edge case pelanggan, dan rollout yang tidak merusak produksi
    • Lab hanya menjual model berikutnya dan memberi tahu pelanggan untuk "bermigrasi", sedangkan perusahaan Rest of Oz menyerap migrasi itu sehingga pelanggan mendapat kecerdasan terbaik dari seluruh pasar sekaligus kontinuitas upgrade
  • Cost optimization (optimisasi biaya)

    • Menjalankan semua query di Opus 4.7 adalah jalan tercepat menuju margin kotor negatif
    • Perusahaan Rest of Oz terbaik melakukan routing model per tier
      • model frontier untuk tugas tersulit
      • model mid-tier untuk sebagian besar tugas
      • model kecil kustom atau fine-tuned untuk bagian yang memenuhi syarat
    • Sebagian perusahaan juga melakukan post-training sendiri di atasnya, mengoptimalkan untuk irisan sempit yang benar-benar dipedulikan pelanggan, dan melayani dengan sebagian biaya dibanding API frontier
    • Jika lab menetapkan harga dasar berupa "tingkat kecerdasan minimum seharga X dolar", maka perusahaan Rest of Oz menjual kebalikannya: biaya dolar terendah untuk tingkat kecerdasan yang benar-benar dibutuhkan workflow
  • Governance (tata kelola)

    • Ada nilai besar dalam menjadi control plane untuk cara pelanggan menjalankan AI di vertikal tersebut — izin, audit, apa yang boleh dilakukan agen, dan apa yang benar-benar telah dilakukannya semuanya berkumpul di sana
    • Control plane dibentuk oleh guardrail per use case yang sangat berbeda menurut industri dan fungsi kerja
    • Karena memiliki alat, workflow, dan data secara end-to-end, mereka bisa memberikan hasil deterministik yang sulit dicapai alat horizontal
    • Mereka menjadi pihak yang menyerap kompleksitas regulasi alih-alih pembeli akhir
      • hukum: FRCP dan aturan etika pengacara
      • kesehatan: HIPAA
      • keuangan: SEC dan FINRA
      • asuransi: regulasi asuransi tingkat negara bagian, dan seterusnya
    • CIO menginginkan mitra yang bertanggung jawab secara kontraktual atas kepatuhan agen yang diberikan
  • Kesimpulan bersama: fokus

    • Baik itu vertikal seperti asuransi, hukum, akuntansi, maupun fungsi yang dijalankan secara mendalam seperti penjualan, dukungan pelanggan, atau keuangan, dibutuhkan tim yang berkomitmen pada workflow, edge case, dan regulasi dari satu kumpulan pelanggan tertentu
    • Lab tidak bisa melakukan pekerjaan ini karena mereka harus hadir di mana-mana untuk semua orang — pilihannya adalah "ada di mana-mana" atau "sangat baik dalam satu hal"

Kasus Sales — tips praktik dari CEO 11x, Prabhav Jain

  • Focus on outcomes (fokus pada hasil)

    • Jalur taktis untuk membangun perusahaan yang tahan terhadap lab adalah memulai dari hasil spesifik yang benar-benar dipedulikan pelanggan — dalam kasus 11x, pipeline generation
    • Mengurai tiap aktivitas menjadi tugas → membedakan mana yang agentic dan mana yang tidak, mana yang membutuhkan insight domain yang canggih dan mana yang tidak
    • Dalam workflow yang multi-tahap, input-nya berantakan, statusnya sulit ditafsirkan, dan ada batasan dunia nyata, model yang lebih baik saja tidak cukup; dibutuhkan rekayasa perangkat lunak konvensional, dan di permukaan ini lab tidak punya keunggulan
    • Contoh tugas yang ditangani 11x
      • prospecting lead berbasis sinyal kustom, lead enrichment, deep account research
      • pengambil konteks CRM, penulis pesan per kanal, agen validasi kualifikasi lead, sistem deliverability email
    • Tugas perusahaan aplikasi adalah menyuntikkan pengetahuan domain yang tidak ada dalam data pelatihan umum ke dalam model pada titik workflow yang tepat, dan itu terakumulasi
    • Skill terus menjadi usang seiring evolusi bisnis, sehingga kemampuan untuk mengembangkan workflow dan konteks itu sendiri menjadi keunggulan kompetitif
      • Contoh: sejak email yang ditulis AI mulai muncul, intuisi pengguna berubah setiap beberapa bulan, dan agen harus terus beradaptasi dengan dinamika pasar
      • Dalam beberapa bulan terakhir, positive reply rate naik 4x, menghasilkan pipeline bernilai ratusan juta dolar untuk pelanggan
  • Work on problems where complexity is high (kerjakan masalah dengan kompleksitas tinggi)

    • Nilai bisnis nyata dibuka dari masalah kompleks; jika tidak, produk hanya menjadi thin wrapper
    • Contoh GTM: aturan sederhana seperti "jangan menghubungi kontak di perusahaan yang sudah menjadi pelanggan" ternyata sangat kompleks dalam praktik
      • Bisa ada pemetaan domain di CRM, perusahaan dengan puluhan anak usaha, hanya domain perusahaan induk yang tercatat, atau field matching di Salesforce yang stale sehingga cold pitch terkirim ke CRO pelanggan saat ini
    • Data dunia nyata berantakan, dan baik manusia maupun model tidak bisa menyelesaikannya secara ajaib — dibutuhkan agen purpose-built yang direkayasa sesuai bentuk konkret masalahnya
    • Menurut data 11x, kualitas dan kesegaran data internal mereka lebih baik daripada data di pihak pelanggan, sehingga pendekatan dasarnya adalah meng-anchoring pada data mereka sendiri
  • Guardrails — bukan sekadar mencegah hal buruk, tetapi inti yang dibayar pelanggan

    • Guardrail sangat diremehkan, dan bahkan dalam produk yang sama pun dibutuhkan guardrail terpisah per use case
    • Prospek layanan keuangan yang teregulasi dan pelanggan SaaS mid-market membutuhkan jaminan yang berbeda, dan ini memengaruhi cara agen menulis, siapa yang dihubungi, data apa yang diakses, apa yang dikatakan saat menelepon, hingga bagaimana keputusan dicatat
    • Sistem one-size-fits-all akan runtuh; yang dibutuhkan adalah desain per use case, konfigurasi per pelanggan, dan audit berkelanjutan
    • Untuk itu mereka mengoperasikan FDE (Forward Deployed Engineer) dan ahli strategi deployment teknis yang menyesuaikan sistem dengan kebutuhan pelanggan
    • Contoh institusi F1000
      • menjalankan outbound voice berbasis consent untuk pelanggan SMB dalam skala besar
      • pada iterasi awal, pickup rate rendah → mereka cepat belajar cara membuat pemilik bisnis SMB terlibat dalam 10 detik pertama panggilan
      • pemilik bisnis SMB berperilaku berbeda dari pembeli B2B besar atau konsumen; kini untuk segmen itu mereka menciptakan lebih banyak peluang penjualan dalam sehari daripada tim sales pelanggan dalam sebulan

Kasus Insurance — Aman Gour, CEO FurtherAI

  • Saat berulang kali menerapkan AI ke operasi asuransi, ia sering menjumpai asumsi bahwa "model adalah kecerdasan dan workflow hanyalah scaffolding" — tetapi makin lama bekerja dengan carrier, ia justru makin yakin bahwa kenyataannya kebalikannya
  • Dalam asuransi, sebagian besar kecerdasan justru berada di dalam workflow itu sendiri
    • Bahkan jika dua carrier mengikuti jalur yang sama (submission → review → quote → bind), perbedaannya ada pada semua hal di dalamnya
      • risiko mana yang di-escalation
      • sinyal kerugian mana yang penting
      • aturan appetite mana yang menang saat konflik
      • kapan persetujuan manusia masuk, kapan data eksternal dipanggil, dan bagaimana keputusan akhir didokumentasikan
    • Logika ini tidak berada rapi di satu rules engine, melainkan tersebar di SOP, review manajer, filosofi underwriting, appetite khas carrier, dan pengalaman operasional bertahun-tahun; banyak di antaranya bahkan tidak terdokumentasi dalam bentuk yang bisa dibaca model
  • Kesimpulannya bukan agen murni yang menalar ulang semuanya dari nol setiap kali, dan bukan pula workflow kaku yang mudah rusak saat realitas menjadi berantakan, melainkan agentic workflows
    • workflow → repetabilitas, auditabilitas, kontrol biaya
    • agen → menangani variabilitas, pulih saat happy path rusak
    • human-in-the-loop → panggilan penilaian saat akuntabilitas penting
  • Pada Day 1, yang terjadi adalah otomatisasi kerja manual; seiring waktu, setiap escalation menjadi sinyal, setiap pengecualian menjadi feedback, dan setiap koreksi manusia mengungkap bagian runbook yang hilang, sehingga workflow berevolusi menjadi operating memory milik carrier
  • Lab akan terus merilis model yang lebih baik dan agen umum yang lebih baik, tetapi mereka tidak bisa belajar akun mana yang dieskalasi, risiko mana yang ditolak, atau mengapa underwriter benar ketika membalikkan panduan appetite, kecuali mereka tinggal cukup lama di dalam produksi carrier
  • "Bukan workflow yang dirilis pada Day 1 yang menjadi moat, melainkan loop yang dibentuk oleh penggunaan produksi seiring waktu"

3 tes untuk menentukan apakah Anda termasuk Sisa Wilayah Oz

  • The tools-and-steps test (tes alat dan langkah)

    • Berapa banyak langkah yang dilalui suatu tugas, dan seberapa kompleks alat pendukungnya
    • Perbandingan
      • pencarian AI horizontal (melintasi Google Drive): 1 langkah, 1 alat, hasil toleran — jika salah, tinggal tanya lagi
      • legal redline (dibandingkan dengan preseden firma 3 tahun): puluhan langkah, banyak alat, output harus lolos review partner dan bisa diperdebatkan di pengadilan
    • Keduanya sama-sama terlihat seperti "agen yang bekerja", tetapi hanya satu yang membutuhkan software mendalam yang dibangun tim fokus selama bertahun-tahun
  • The system test (tes sistem)

    • Apakah Anda sedang membangun sistem tempat pekerjaan pelanggan mengalir, atau hanya alat di atas sistem yang sudah ada
    • Sistem memiliki data capture, governance, dan rekam pelaksanaan secara end-to-end, serta menjadi hal yang ditunjuk pelanggan sebagai "tempat kerja nyata terjadi"
    • Alat hanya menambahkan kecerdasan ke workflow yang sudah dijalankan pelanggan; ini tetap bisa menghasilkan pendapatan, tetapi merupakan area yang bisa diambil lab
    • ACV tinggi sering menjadi sinyal adanya sistem, tetapi bukan jaminan — tolok ukurnya adalah apakah pelanggan masih membutuhkan alat Anda jika lab meluncurkan produk pesaing secara langsung
  • The hedge fund / P&L test (tes hedge fund / P&L)

    • Kinerja lab dievaluasi lewat benchmark; kinerja Rest of Oz dievaluasi lewat P&L pelanggan
    • Pelanggan tidak peduli pada skor SWE-Bench atau MMLU — mereka melihat apakah agen menutup deal, melakukan redline kontrak dengan benar, atau melakukan bind pada polis yang tepat
    • Pelanggan yang terobsesi pada hasil spesifik workflow → Rest of Oz; pelanggan yang membayar untuk kemampuan umum → seat Claude atau Codex sudah cukup
    • Bisnis agen terbaik harus bersaing seperti hedge fund, dengan alpha yang diukur lewat P&L pelanggan

Kedua sisi bisa menang

  • Akan ada pemenang raksasa juga di atas Jalan Bata Kuning — lab memiliki model dan juga distribusi untuk alat horizontal yang mereka rancang sendiri
  • Kondisi kemenangan di Rest of Oz adalah memiliki system of work — permukaan tempat pekerjaan perusahaan benar-benar dijalankan dan data ditangkap
    • memiliki data capture, sistem aksi dalam workflow, dan governance
    • semakin workflow kompleks di vertikal matang, semakin terkondensasi menjadi satu pengalaman inti yang diandalkan pelanggan
    • ketika generasi model lama dan baru dirilis, perusahaan menjadi lapisan yang mengintegrasikan dan menyampaikannya
    • model di bawahnya fungible, tetapi system of work tidak
  • Software enterprise generasi berikutnya akan dibangun "di luar jalan"

Belum ada komentar.

Belum ada komentar.