4 poin oleh GN⁺ 3 jam lalu | 2 komentar | Bagikan ke WhatsApp
  • Seiring model AI makin kuat, nilai perangkat lunak itu sendiri menurun; perusahaan aplikasi yang ingin bertahan perlu berubah sekaligus menjadi perusahaan data dan perusahaan fintech
  • Saat agen menjadi pengguna utama perangkat lunak, model harga per-seat runtuh; seribu orang yang menjalankan seratus ribu agen bukan berarti seratus ribu seat, sehingga yang tersisa untuk ditagih hanyalah keputusan yang ditinggalkan agen (data) dan uang yang dipindahkannya (fintech)
  • Model frontier ibarat sekelompok genius yang tidak tahu cara sebuah perusahaan beroperasi; judgment implisit yang dimiliki orang-orang adalah moat sesungguhnya, sementara riwayat koreksi (corrections) saat pengguna memperbaiki keluaran model menjadi sinyal pembelajaran sekaligus test set
  • Jika tidak ada uang yang mengalir melalui data, itu tak lebih dari proyek sains; hanya fintech dengan jaringan dan lock-in seperti Toast, Ramp, dan Shopify yang bisa mempertahankan margin meski harga model turun
  • Akumulasi judgment, penguasaan aliran uang, dan mempertahankan writes adalah satu-satunya cara agar perusahaan tetap tidak tergantikan meski Lab melihat semua token

Perkembangan model dan penurunan nilai perangkat lunak

  • Kemarin Claude Fable 5 dirilis; ini model Mythos-class pertama yang bisa digunakan publik, menempati peringkat pertama di hampir semua benchmark, dan jaraknya makin lebar semakin panjang pekerjaannya
    • Semakin pintar model, semakin turun nilai perangkat lunak itu sendiri
  • Setiap perusahaan aplikasi yang didanai venture kini harus menjadi perusahaan data atau perusahaan fintech, idealnya keduanya

Perubahan siapa yang menggunakan perangkat lunak

  • Dalam tulisan dua tahun lalu, sudah disebutkan bahwa ketika agen menjadi pengguna, model harga per-seat akan pecah, dan tampaknya kita sudah melewati garis itu
    • Cloudflare mengumumkan bahwa trafik agen untuk pertama kalinya melampaui trafik manusia
    • Ada perdebatan online, tetapi tren bahwa agen menjadi pelanggan utama semua perangkat lunak sudah jelas
  • Seribu karyawan yang menjalankan seratus ribu agen bukanlah seratus ribu seat
  • Dua hal dari agen yang bisa ditagih adalah keputusan (=data) yang dibuatnya dan uang (=fintech) yang dipindahkannya

Decisions — moat bernama data

  • xAI memiliki opsi untuk mengakuisisi Cursor senilai 60 miliar dolar; Cursor punya pendapatan tahunan teranualisasi sekitar 4 miliar dolar
    • Bukan perangkat lunaknya yang menjadi alasan utama harga mahal itu
    • Anthropic dan OpenAI sudah mengamati pekerjaan developer secara real-time lewat Claude Code dan Codex
    • Alasan xAI membeli Cursor adalah untuk masuk paling cepat ke token flow
    • Musk (triliuner pertama di dunia) menyebut bahwa rekaman jutaan developer yang benar-benar memakai model akan langsung masuk ke pelatihan Grok; harga tinggi itu adalah biaya tol untuk melompati bertahun-tahun pengumpulan data yang lambat
  • Beberapa minggu setelah Cursor diluncurkan, muncul clone yang berfungsi, tetapi tidak ada yang berhasil bertahan, karena pertarungannya ada pada taste
    • Ribuan judgment kecil tentang apa yang ditampilkan dan kapan harus menghilang
    • Clone hanya meniru antarmuka; mereka tidak bisa mewarisi riwayat bertahun-tahun developer menerima, menolak, dan menulis ulang
    • Cursor kini melatih modelnya sendiri dengan diff tersebut; data menjadi moat utama
  • Alasan valuasi 60 miliar dolar: ini seperti mengganti 90% karyawan dengan tim genius yang sama sekali tidak tahu cara perusahaan beroperasi
    • Fable 5 menyelesaikan 80% pekerjaan perangkat lunak nyata yang tahun lalu hanya bisa diselesaikan setengahnya oleh model terbaik; para genius sulit dibedakan satu sama lain dan bisa diganti
    • Satu alasan mereka gagal: tidak ada yang tahu apa yang diketahui orang-orang yang digantikan

Tacit knowledge dan akumulasi judgment

  • Solusi sementara adalah mengeluarkan pengetahuan dari kepala manusia dan memberikannya ke model sebagai konteks, tetapi sebagian besar tidak ada dalam bentuk terstruktur
    • Deal yang ditinggalkan, satu baris kode yang di-rollback pukul 2 pagi, pelanggan yang tidak dikejar siapa pun dan alasannya tidak ditulis — itulah inti sebenarnya
    • Ini adalah judgment yang tidak bisa dituliskan sebagai workflow dan saat ini tidak disimpan
  • Kini kita bergerak dari context → harness → judgment
    • Context adalah retrieval, menaruh potongan yang tepat di depan model
    • Harness adalah loop tempat model bisa berjalan (scaffolding)
    • Judgment adalah lapisan terakhir sekaligus satu-satunya lapisan yang tumbuh secara compounding; semua call, koreksi, dan rollback meninggalkan jejak di atas data
  • Hampir setiap pitch aplikasi AI yang terlihat sekarang menjadikan slide context sebagai moat, tetapi kini itu hanya table stakes
    • Karena semua pesaing sedang merakit konteks dengan cara yang sama

Dua peran riwayat koreksi (corrections)

  • Koreksi bisa dilihat sebagai scorecard; setiap kali pengguna memperbaiki hasil model, itu mencatat apa yang benar dalam bisnis tersebut
  • Scorecard menjalankan dua hal sekaligus
    • Sinyal pembelajaran untuk menyesuaikan model pinjaman dengan bisnis itu
    • Test set, satu-satunya cara untuk mengetahui apakah agen benar-benar membaik; benchmark publik tidak dapat mengukur workflow spesifik
  • Tidak perlu melatih model dari awal; bahkan Cursor pun tidak melakukannya
    • Model internal Cursor berdiri di atas basis open source, dan diff-lah yang membuatnya berbeda
    • Biaya fine-tuning dan RL di atas model frontier sudah cukup murah sehingga perusahaan Series B pun bisa menjalankan loop ini; dua tahun lalu masih perlu lab
  • Sarah Guo menyebut wilayah ini the untrainable (pekerjaan yang jawabannya tidak bisa dinilai dari luar); koreksi adalah cara untuk memilikinya

Contoh para pemimpin AI vertikal

  • Harvey menembus 11 miliar dolar, Legora menembus 5 miliar dolar; keduanya menyasar pasar hukum
    • Mereka berlari melampaui tool mandiri menuju kepemilikan seluruh perkara (matter), karena koreksi yang dilakukan pengacara pada draf adalah corrections yang tidak bisa dilihat siapa pun
  • Rogo memakai strategi yang sama di keuangan, menangkap proses saat analis membangun model dan memperbaiki memo
  • Tidak satu pun dari mereka melatih foundation model; mereka membangun harness di sekitar model pinjaman dan memiliki judgment yang mengalir di dalamnya, dan itulah yang tumbuh secara compounding
  • Pemain lama juga sama
    • Figma memiliki lebih dari sekadar SVG: sejarah desain dari v1 hingga v47 dan semua versi yang dibuang di tengah jalan — riwayat penilaian taste desain yang sudah diberi skor
    • Linear memiliki perdebatan di bawah setiap tiket yang ditutup
    • Notion memiliki bentuk pemikiran tim yang terbentuk lewat seribu kali edit
    • Walau pesaing mencoba merebut pelanggan, semua ini tidak bisa diekspor; inilah jawaban yang tidak dimiliki model generik

Tren Lab membeli judgment

  • Lab mulai membeli judgment siap pakai, dimulai dari data berlabel manusia
    • Mercor bernilai 10 miliar dolar dan membayar jaringan pakar 85 dolar per jam
    • Meta membayar 14 miliar dolar kepada Scale untuk memiliki pipeline
    • Sebuah startup di New York membersihkan apartemen secara gratis jika seluruh prosesnya boleh direkam, karena tim robotika perlu melihat manusia memutuskan tindakan berikutnya
    • Banyak perusahaan RL environment menjual judgment untuk pekerjaan jangka panjang dan mencapai pendapatan tahunan teranualisasi ratusan juta dolar
  • Lab sudah kehabisan setelah melatih pada seluruh internet, dan kini membeli keputusan secara langsung

Dollars — moat bernama fintech

  • 23andMe bangkrut tahun lalu meski memiliki DNA lima belas juta orang
    • Jika tidak ada uang yang mengalir melalui data, itu hanya antrean pendanaan untuk proyek sains
    • Kebanyakan founder melewatkan separuh ini
  • Toast sudah memahami hal ini bertahun-tahun lalu; restoran pada dasarnya adalah pemroses pembayaran dengan dapur yang menempel
    • Pembayaran menghasilkan pendapatan yang jauh lebih besar daripada perangkat lunak
  • Ramp melangkah lebih jauh: kartu korporat gratis, tanpa biaya di mana pun, lalu mengambil 1–2 sen dari setiap dolar ketika miliaran dolar mengalir
    • Perusahaan 32 miliar dolar yang dibangun dari kesalahan pembulatan; kartu gratis adalah pintu depan menuju interchange
    • Swipe fee bertahan karena ditopang jaringan, dan uang juga mengumpulkan float selama mengendap, menghasilkan pendapatan
  • Tidak semua meteran uang punya moat
    • Sebuah aplikasi vibe-coding populer memiliki margin sekitar 50% dari kredit yang dijualnya; sebagian besar pendapatan tahunan teranualisasi adalah markup atas inference
    • Di balik markup token tidak ada jaringan, dan biaya inference internalnya sendiri turun tiap kuartal; saat model makin murah, margin mencair
    • Fintech yang berkelanjutan adalah yang dibangun di atas lock-in — pembayaran yang ditopang jaringan, pinjaman yang dijamin dengan data yang tidak bisa dilihat bank

Infrastruktur pembayaran untuk agen

  • Infrastruktur pembayaran untuk agen akhirnya mulai berjalan
    • Saat agen memesan tiket pesawat, memesan komponen, dan membayar vendor, harus ada sesuatu yang menyetujui tagihan, mengangkutnya, dan mengambil fee
    • Stripe merilis protokol untuk ini, sementara Visa dan Mastercard bersaing merebut standar
    • OpenAI sudah memotong beberapa persen dari setiap pembelian yang dilakukan agennya
    • Transaksi satu triliun agen akan segera menjadi ekonomi pembayaran terbesar dalam sejarah

Mengubah satu menjadi yang lain

  • Perusahaan aplikasi terbaik yang bertahan lama tidak memperlakukan dua separuh ini secara terpisah
    • Judgment adalah catatan keputusan tentang pekerjaan; fintech adalah catatan keputusan tentang uang; perusahaan kuat mengubah satu menjadi yang lain
  • Shopify adalah contoh terbaik
    • Bermula sebagai perangkat lunak toko → menempelkan pembayaran → melalui Shopify Capital, menyediakan pinjaman yang dijamin oleh data pendapatan yang mengalir melalui toko, pinjaman yang tidak bisa dilakukan bank sendirian
    • Saat merchant tumbuh, pendapatan naik dan data membantu pinjaman berikutnya
    • Saat ini sekitar tiga perempat pendapatan Shopify berasal dari sisi uang, bukan langganan perangkat lunak
    • Stripe menjalankan loop yang sama dengan Radar, Ramp dengan data belanja dan kartu
  • Rippling juga mencoba hal serupa; objek intinya adalah karyawan
    • Payroll, benefit, perangkat, dan kartu bergantung pada satu source of truth
    • Belum ada yang berhasil melakukan lock-in, dan Gusto serta Deel juga tumbuh berdampingan, tetapi perusahaan yang memiliki objek tersebut menumbuhkannya secara compounding sementara yang lain merakitnya secara manual

Pertahankan writes

  • Ada ketegangan “headless” yang belum dipecahkan siapa pun
    • Ketika semua perangkat lunak digunakan oleh agen, agar berguna Anda harus membiarkan agen masuk, tetapi agar bertahan Anda tidak bisa membiarkan mereka mengambil semuanya
    • Setiap system of record harus cukup terbuka agar agen bisa terhubung lewat protokol apa pun, sekaligus cukup tertutup agar setelah mendapatkan yang dibutuhkan, tidak ada yang bisa pergi
    • Salesforce tahun ini memblokir data Slack dari Glean dan agen eksternal; ini contoh publik pertama
  • Cara membangun perusahaan yang berkelanjutan adalah dengan memisahkannya
    • Izinkan agen untuk membaca; membaca murah dan bagaimanapun penting
    • Pertahankan writes
  • Titik tempat judgment baru dimasukkan dan manusia serta agen saling menyetujui, mengoreksi, dan me-rollback adalah bagian yang tidak mudah dipindahkan pesaing
    • Yang mereka scrape hanyalah keadaan kemarin; hanya keputusan yang dibuat saat ini yang tetap menjadi milik sendiri

“Bagaimana jika Anthropic membuat ini?”

  • Bisa saja ada bantahan bahwa Lab sudah berada di dalam token flow, jadi di mana moat-nya?
    • Claude Code melihat setiap perintah yang dijalankan developer dan saran yang diabaikan; ChatGPT dalam sehari mengamati lebih banyak keputusan daripada yang dicatat produk selama setahun
  • Jawaban atas bantahan itu: yang dilihat tool mereka sebagian besar generik
    • Coding dan penulisan yang sama yang dilihat semua model, justru hal yang diperebutkan lab untuk dijadikan komoditas
    • Judgment yang langka ada jauh di dalam satu perusahaan — cara rumah sakit membaca scan, deal yang dipelajari perusahaan untuk ditinggalkan, tidak satu pun menyentuh kotak chat lab
  • Selama bertahun-tahun Lab mengatakan kepada perusahaan bahwa mereka tidak melatih model dengan data perusahaan tersebut
    • Tacit knowledge yang melewati model di dalam produk tetap menjadi milik perusahaan melalui kontrak; mereka melihat trace lewat, tetapi sepakat untuk tidak menyimpannya
  • Separuh fintech bahkan bukan sesuatu yang diinginkan lab
    • Lab senang mengambil data, tetapi loan book, kerugian fraud, dan lisensi money-transmitter di 40 negara bagian tidak berguna bagi mereka
    • Bagi pembeli, data menciptakan nilai untuk diakuisisi, sedangkan fintech membuatnya sulit dipisahkan
  • Cursor membangun mesin data terbaik di kategorinya dan lab mengakuisisinya seharga 60 miliar dolar
    • Apakah ini mimpi atau peringatan, Anda tidak akan tahu sampai sudah terlalu terlambat untuk mengubahnya
    • Bangun dua hal yang bertahan — akumulasi judgment dan duduk di jalur uang; itulah cara bertahan dari pertanyaan “Bagaimana jika Anthropic membuat ini?”

2 komentar

 

Kedengarannya cukup masuk akal, tapi sulit dipahami ya.

 
somang04 2 jam lalu

Akumulasi penilaian, penguasaan arus uang, dan pertahanan terhadap writes adalah satu-satunya cara agar perusahaan tetap tak tergantikan meskipun lab melihat semua token -> maknanya agak ambigu; bisakah dijelaskan lebih lanjut?