45 poin oleh GN⁺ 2026-02-05 | Belum ada komentar. | Bagikan ke WhatsApp
  • Di era ketika AI menulis semua perangkat lunak, perangkat lunak yang menghemat token (biaya inferensi) akan bertahan melalui tekanan seleksi evolusioner
  • Kecocokan perangkat lunak dapat diukur lewat rumus rasio kelangsungan hidup, dan hanya yang penghematan kognitifnya melampaui biaya kognitifnya (lebih dari 1) yang dapat bertahan
  • Alat seperti Git dan grep adalah contoh ketika biaya bagi AI untuk membuat ulang dan memakainya kembali menjadi sangat tidak masuk akal berkat kompresi wawasan dan efisiensi substrat
  • Agar agen mengadopsi alat, Awareness dan Friction yang minimal itu penting, dan desain Desire Paths efektif untuk itu
  • Bahkan di era yang berpusat pada AI, Human Coefficient tetap bekerja, sehingga ranah tempat campur tangan dan preferensi manusia menciptakan nilai langsung akan terus bertahan

Latar belakang: prediksi perangkat lunak di era AI

  • Sejak Juni 2024 melalui Death of the Junior Developer, prediksi datangnya orchestrator 10 bulan sebelumnya, dan proyek Gas Town, penulis terus tepat membaca kurva perkembangan AI
  • Pengembangan Gas Town berasal dari ekstrapolasi alur 2023 autocomplete kode → 2024 antarmuka percakapan → awal 2025 agen → awal 2026 orkestrasi
  • Dasar dari semua prediksi itu adalah sikap mempercayai kurva pertumbuhan eksponensial apa adanya
  • Penulis sepenuhnya mempercayai arah yang selama ini dikemukakan Dario Amodei dan Andrej Karpathy tentang masa depan perangkat lunak
  • Gas Town menjadi contoh bahwa ekstrapolasi ini benar-benar bekerja, dengan lebih dulu membuktikan bentuk yang nyaris nyaris bisa berdiri melalui model akhir 2025 dan banyak tambalan sementara

Ekosistem perangkat lunak yang terancam

  • Tekanan terhadap perusahaan SaaS meningkat, dan struktur biaya beli vs bangun berubah sehingga makin banyak divisi bisnis langsung membuat SaaS sendiri lewat vibe coding
  • Berbeda dengan hanya 3 tahun lalu saat GPT-3.5 masih kesulitan menulis satu fungsi pun, kini AI bisa langsung menghasilkan SaaS kecil namun bernilai nyata
  • Stack Overflow dan Chegg terkena pukulan awal, lalu tekanan menyebar ke perangkat lunak dukungan pelanggan Tier-1, sistem low-code/no-code, alat pembuatan konten, dan berbagai alat produktivitas
  • Vendor IDE juga mulai merasakan tekanan persaingan sejak kemunculan Claude Code
  • Karena prediksi para peneliti AI telah menunjukkan akurasi tinggi selama sekitar 40 tahun, semua ranah perangkat lunak perlu bersiap dengan asumsi bahwa semuanya berpotensi terancam

Model tekanan seleksi (Selection Argument)

  • Inferensi membutuhkan token, konsumsi token berujung pada penggunaan energi, dan energi pada akhirnya dapat dikonversi menjadi biaya
  • {token, energi, uang} dapat diperlakukan sebagai kendala sumber daya yang sama, dan selalu berada dalam keadaan terbatas
  • Aturan sederhana bahwa perangkat lunak yang mengurangi biaya kognitif akan bertahan membentuk seluruh ekosistem perangkat lunak
  • Ini memiliki struktur yang sama dengan tekanan seleksi evolusioner, di mana entitas yang memakai sumber daya terbatas secara lebih efisien akan menyingkirkan yang tidak efisien

Rumus rasio kelangsungan hidup (Survival Ratio)

  • Survival(T) ∝ (Savings × Usage × H) / (Awareness_cost + Friction_cost)
  • Savings: biaya kognitif yang dihemat dengan memakai alat, yaitu jumlah token yang dihemat dibanding menyintesis fungsi yang sama dari nol
  • Usage: frekuensi dan cakupan penerapan alat secara berulang dalam berbagai situasi
  • H (Human Coefficient): koefisien yang mencerminkan permintaan yang tetap memberi nilai pada sesuatu buatan manusia terlepas dari efisiensi
  • Awareness_cost: energi yang dibutuhkan agar agen mengetahui keberadaan alat, mengingatnya, dan memilihnya pada saat yang tepat
  • Friction_cost: energi yang habis karena error, kegagalan, percobaan ulang, dan salah paham selama proses penggunaan sebenarnya
  • Rasio minimum untuk bertahan adalah 1, dan di lingkungan yang kompetitif biasanya dibutuhkan nilai yang jauh lebih tinggi
    • Contoh: alat dengan rasio 1,2 bisa tersingkir oleh alat pesaing yang mencatat 2,5

Tuas 1: kompresi wawasan (Insight Compression)

  • Industri perangkat lunak memampatkan pengetahuan yang terlalu mahal untuk ditemukan kembali selama puluhan tahun menjadi bentuk yang bisa dipakai ulang
  • Git adalah contoh utamanya; commit DAG, ref sebagai pointer, index, reflog, dan seterusnya merupakan struktur yang memadatkan trial-and-error selama puluhan tahun
    • Jika AI ingin mengimplementasikan ulang semua ini dari nol, ia harus menapaki kembali sejarah intelektual yang sama sehingga secara ekonomi sama sekali tidak masuk akal
  • Prinsip yang sama berlaku pada database, compiler, sistem operasi, workflow engine, dan sistem monitoring
  • Kubernetes rumit bukan karena desainnya ceroboh, tetapi karena sistem terdistribusi memang secara inheren rumit
  • Temporal menyediakan durable execution karena mengimplementasikan langsung pola saga beserta retry idempoten pada praktiknya nyaris seperti proyek riset
  • Ciri umum perangkat lunak yang kuat adalah kepadatan wawasan yang membuat upaya menyintesis ulang terasa konyol sejak awal
  • Model peran karakter di Gas Town atau verba seperti gt sling juga merupakan contoh kompresi konsep kompleks menjadi ungkapan pendek yang mudah diingat

Tuas 2: efisiensi substrat (Substrate Efficiency)

  • grep adalah contoh lain di mana penemuan ulang nyaris seperti tindakan gila
  • Walau cukup sederhana hingga Ken Thompson bisa membuatnya dalam setengah hari, ia menghemat biaya kognitif dalam jumlah besar lewat pemrosesan berbasis CPU
  • Untuk pencocokan pola teks, CPU mengungguli GPU dengan selisih beberapa orde besaran
  • Cara perkalian LLM adalah menggabungkan pencocokan pola untuk lebih dulu menebak “sekitar 94”, lalu membetulkan digitnya memakai lookup table yang diingat
    • Semua perhitungan ini berjalan di atas substrat yang sangat tidak efisien berupa tahap inferensi GPU
  • Kalkulator, parser, alat transformasi kompleks seperti ImageMagick, dan banyak utilitas CLI Unix memanfaatkan tuas ini secara agresif
  • Dengan menerapkan algoritme yang baik atau memindahkan komputasi ke substrat yang lebih murah seperti CPU atau manusia, token dan energi dapat dihemat

Tuas 3: utilitas luas (Broad Utility)

  • Ini sesuai dengan komponen Usage dalam model rasio kelangsungan hidup
  • Makin luas cakupan penggunaan, makin tersebar biaya awareness, dan makin rendah ambang penghematan token yang dibutuhkan di tiap penggunaan
  • Untuk alat penghemat token yang benar-benar serbaguna, meskipun AI secara teori bisa mengimplementasikannya ulang, pilihan yang sudah ada di mana-mana dan dipakai luas akan diprioritaskan
  • Temporal meski memiliki biaya awareness dan friction yang relatif tinggi, tetap menawarkan model workflow yang sama serbagunanya dengan PostgreSQL
    • Ia memiliki ketiga tuas sekaligus: kompresi wawasan yang agresif, pemanfaatan substrat komputasi yang cakap, dan utilitas yang luas
  • Dolt adalah database yang dikelola versinya dengan Git dan merupakan proyek open source yang telah dipelihara selama 8 tahun
    • Belakangan ia menemukan killer app dalam workflow produksi dan DevOps berbasis agen
    • Bahkan jika agen membuat kesalahan di lingkungan produksi, seluruh kemampuan Git dapat dipakai untuk rollback dan rollforward
  • Mesin pencari kode menjadi jauh lebih penting ketika LLM menghasilkan kode 10 hingga 100 kali lebih banyak daripada sebelumnya
    • Terbentuk ceruk serbaguna skala besar yang bisa disebut “terlalu besar untuk grep”
    • Karena menyelesaikan masalah nontrivial dengan banyak edge case yang sulit ditemukan, memakai substrat komputasi murah, dan dapat diterapkan secara umum, alat ini memenuhi ketiga tuas sekaligus

Tuas 4: publisitas (Publicity)

  • Menghemat biaya kognitif saja tidak cukup; masalah awareness, yaitu masalah pada tahap pra-seleksi, juga harus diselesaikan
  • Dolt memiliki tuas 1 hingga 3, tetapi pada awalnya tidak banyak dipakai karena lemah pada tuas 4
  • Ada berbagai cara untuk membayar biaya awareness
    • Membuat produk hebat, menjadi populer, lalu menunggu agar secara alami masuk ke data pelatihan lewat komunitas
    • Atau mengeluarkan biaya untuk berinvestasi pada dokumentasi untuk agen atau menjalankan iklan
  • Cara yang lebih langsung adalah bekerja sama dengan pihak di frontier lab seperti OpenAI, Anthropic, dan Google agar alat dimasukkan ke proses pelatihan model
    • Dalam bentuk layanan berbayar, dibuat eval yang menunjukkan penggunaan yang benar maupun penyalahgunaan alat, lalu peneliti menyesuaikan pelatihannya
  • Konsep SEO untuk agen mulai benar-benar muncul
  • Jika sulit mengalokasikan anggaran besar, maka harus mengandalkan energi pada tahap pasca-seleksi, yaitu tuas 5, sehingga alat perlu dirancang semaksimal mungkin ramah bagi agen

Tuas 5: meminimalkan friction (Minimizing Friction)

  • Jika awareness adalah masalah tahap pra-seleksi, maka friction produk adalah masalah tahap setelah penggunaan dimulai
  • Agen selalu bertindak seperti dikejar waktu, dan ketika ada hambatan mereka langsung mencoba jalur memutar
  • Bahkan friction kecil saja dapat mengubah penilaian, sehingga agen mundur ke cara yang kurang efisien tetapi lebih familier dan dapat diprediksi
  • Sebaliknya, alat yang dirancang tepat sesuai seleranya akan dipakai agen berulang kali dengan sangat gigih
  • Pendekatan dokumentasi menunda biaya awareness bukan ke tahap pelatihan, tetapi hingga saat inferensi
    • Konteks langsung disuntikkan dengan penjelasan tentang apa yang dikuasai alat, kapan dan mengapa harus dipakai, panduan mulai cepat, dan jalur ke dokumentasi lanjutan
  • Namun solusi yang lebih baik adalah membuat alat yang terasa intuitif bagi agen
  • Sebagai contoh desain Desire Paths, Beads mengembangkan CLI selama 4 bulan melalui lebih dari 100 subcommand, banyak sub-subcommand, alias, dan sintaks alternatif
    • CLI yang kompleks ini dirancang bukan untuk manusia, melainkan untuk pola penggunaan agen
    • Dengan mengamati cara agen mencoba menggunakannya dan mengubah halusinasi menjadi fitur nyata, kini hampir semua tebakan agen langsung berhasil
  • Hallucination Squatting adalah teknik melacak balik nama domain yang sering dihalusinasikan LLM, mendaftarkannya, lalu mengunggah artefak di alamat itu agar benar-benar diunduh
    • Ini menunjukkan bahkan kelompok peretas tingkat negara pun memahami dan memanfaatkan Agent UX
  • Agent UX sangat menentukan, tetapi masih diabaikan oleh sebagian besar alat
  • Alat ideal mirip dengan alat lain yang sudah familier bagi agen, atau menyusun pemecahan masalah sesuai cara agen ingin berpikir

Tuas 6: Human Coefficient

  • Terlepas dari efisiensi token, ada perangkat lunak yang memperoleh nilai justru dari fakta bahwa manusia terlibat
  • Nilai itu berasal dari faktor seperti kurasi manusia, bukti sosial, kreativitas, kehadiran fisik, dan persetujuan
  • Playlist yang dipilih manusia bisa menang melawan playlist buatan AI yang kualitasnya setara dan lebih efisien energinya
  • Di ranah game, lingkungan yang melibatkan manusia sungguhan umumnya menang, dan jarang ada orang yang hanya ingin bermain melawan AI yang jelas lebih kuat daripada manusia
  • Jejaring sosial yang mengecualikan agen justru bisa dipandang lebih menarik
  • Bahkan jika AI menjadi guru terbaik, sebagian orang tetap akan secara sengaja memilih guru manusia
  • Bahkan di ranah dengan Human Coefficient tinggi, persaingan tetap ketat
    • Dalam dunia versi Karpathy, agen bisa menjadi apa saja bagi siapa saja, dan pada dasarnya sangat adiktif
  • Akibatnya, kemungkinan akan ada banyak perangkat lunak yang sangat tidak efisien tetapi memiliki nilai H yang sangat tinggi

Dasar untuk berharap

  • Perangkat lunak yang memediasi antara manusia dan AI, atau mengambil “peran pura-pura pintar” yang sebentar lagi bisa langsung dilakukan AI sendiri, secara struktural memang berisiko
  • Meski begitu, jumlah perangkat lunak yang perlu ditulis pada dasarnya tak terbatas
    • Menyembuhkan semua penyakit, memodelkan perilaku semua protein, dan semua skenario eksplorasi planet tetap menjadi sasaran
  • Ambisi manusia selalu melampaui kapasitas kognitif yang tersedia, dan bahkan jika biaya token turun, kita akan segera bergerak ke frontier yang lebih jauh
  • Masalah perebutan perhatian sudah berkali-kali berhasil diatasi lewat media cetak, internet, media sosial, iklan real-time, dan aggregator
  • Desain Desire Paths benar-benar efektif, dan bahkan tanpa anggaran pelatihan besar seperti OpenAI, kita tetap bisa membuat alat yang secara alami ingin dipakai agen
  • Human Coefficient jelas ada, dan orang-orang sudah mulai merasa lelah terhadap hal-hal yang terlalu berbau agen
    • Jika dirancang dengan koneksi antarmanusia dan kreativitas sebagai pusatnya, pada akhirnya masalah ini kembali bermuara pada ranah pemasaran dan branding tradisional
  • Ada berbagai jalur bertahan hidup yang disediakan oleh keenam tuas tersebut
  • Jika membangun sesuatu yang upaya membuat ulangnya saja terasa gila, lalu membuatnya mudah ditemukan dan mudah digunakan, peluang untuk bertahan tetap sangat kuat

Belum ada komentar.

Belum ada komentar.