4 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Agen coding dan agen serbaguna dari Anthropic dan OpenAI menunjukkan potensi pendapatan yang lebih besar dari penagihan berbasis penggunaan enterprise dibanding langganan konsumen
  • Pengguna berat Claude Code dan Codex menghabiskan token senilai $2,180.16 berdasarkan harga API dengan langganan $200 per bulan, tetapi pelanggan enterprise tidak lagi mendapat diskon serupa
  • Pada April 2026, kedua perusahaan menyelaraskan biaya Enterprise untuk Codex dan Claude Code/Cowork dengan harga API publik, sekaligus merilis model frontier yang lebih mahal
  • Dari 703 lowongan OpenAI, 229, dan dari 390 lowongan Anthropic, 105, dapat diklasifikasikan sebagai penjualan/dukungan enterprise, menunjukkan pergeseran jelas ke penjualan langsung
  • Kontroversi biaya di Uber dan Microsoft bisa ditafsirkan bukan sebagai kegagalan AI, melainkan sebagai sinyal kelayakan harga: pelanggan merasa mahal, tetapi tetap menggunakannya

Pelanggan enterprise mulai membayar harga API

  • Paket Max $100 per bulan dari Anthropic dan paket Pro $100 per bulan dari OpenAI adalah harga yang sangat menguntungkan bagi pengguna berat agen coding
  • Jika penggunaan 30 hari terakhir dikonversi ke harga token API dengan ccusage, Anthropic Claude Code setara $1,199.79 dan OpenAI Codex setara $980.37
    • Jika digabungkan, artinya token senilai $2,180.16 dipakai hanya dengan membayar $200
    • Bahkan untuk kategori “pengguna yang cukup sering memakai”, bukan yang menjalankan agen seharian penuh, selisihnya tetap sangat besar
  • Asumsi bahwa perusahaan akan mendapat diskon serupa saat memakai agen dalam skala besar ternyata tidak benar
  • Anthropic tampaknya dalam 6 bulan terakhir mengubah paket Enterprise dari struktur lama “termasuk penggunaan yang cukup untuk hari kerja normal” menjadi $20 per kursi per bulan + penagihan API berbasis penggunaan
  • OpenAI juga menerapkan perubahan harga serupa pada April 2026
    • Menurut Codex rate card, pada 2 April 2026 harga Codex diselaraskan bukan lagi berdasarkan tarif per pesan, melainkan berdasarkan penggunaan token API
    • Perubahan 2 April berlaku untuk paket Plus, Pro, ChatGPT Business, dan paket ChatGPT Enterprise baru, baik pelanggan baru maupun lama
    • Pada 23 April, aturan ini juga diterapkan ke semua paket ChatGPT Enterprise lama, termasuk Edu, Health, Gov, dan ChatGPT for Teachers
    • Harga ditampilkan dalam bentuk “credit”, tetapi tampaknya sesuai dengan biaya token API per model
  • Per April 2026, biaya Enterprise untuk OpenAI Codex dan Anthropic Claude Code/Cowork menjadi sama dengan harga API publik
  • Pada bulan yang sama, kedua perusahaan model terdepan itu juga merilis model frontier yang lebih mahal
    • GPT-5.5, yang dirilis 23 April, memiliki harga API 2 kali lipat dibanding GPT-5.4
    • Opus 4.7, yang dirilis 16 April, sekitar 1.4 kali lebih mahal dibanding Opus 4.6 jika tokenizer barunya diperhitungkan
  • Pada April 2026, peluncuran model frontier mahal dan perubahan yang mengikat pelanggan enterprise ke harga API alih-alih diskon besar terjadi secara bersamaan

Penilaian bahwa mereka telah mencapai product-market fit

  • Serangan harga mendadak dari Anthropic dan OpenAI bisa saja terkait persiapan IPO, tetapi faktor yang lebih penting tampaknya adalah bahwa produk agen coding dan agen serbaguna seperti Claude Code/Cowork dan Codex telah menemukan product-market fit
  • ChatGPT memang meraih popularitas massal, tetapi sulit mengubah popularitas itu menjadi pendapatan
    • Pada Februari, OpenAI mengatakan pengguna aktif mingguan ChatGPT mencapai lebih dari 900 juta
    • Pelanggan berbayar konsumen berjumlah 50 juta, yaitu hanya 5.6% dari total
  • Tagihan $10~$20 per pengguna per bulan adalah bisnis yang lumayan, tetapi untuk menanggung biaya infrastruktur $1 triliun, dibutuhkan 1 hingga 2 miliar pelanggan yang bertahan selama 4 tahun
  • Struktur enterprise yang membuat perusahaan menghabiskan lebih dari $200 per pengguna per bulan bisa menghasilkan pendapatan besar jauh lebih cepat
    • Untuk pengguna power user, tingkat pemakaian saat ini sudah setara dengan biaya API sekitar $1,000 per vendor per bulan
  • Agen coding mengonsumsi token jauh lebih banyak, tetapi juga sedang menjadi alat kerja sehari-hari bagi profesional berupah tinggi
    • Saat ini fokus utamanya masih pada software engineer
    • Karena dapat mengotomatisasi pekerjaan yang bisa diproses dengan memasukkan perintah ke komputer, teknologinya juga bisa diterapkan pada pekerja pengetahuan terampil yang lebih luas
  • Model yang dirilis pada November 2025 mendorong agen ke tingkat yang benar-benar berguna, dan dalam 6 bulan sesudahnya perusahaan mulai menyesuaikan diri dengan teknologi ini sehingga pengeluaran nyata mulai meningkat
  • ChatGPT bisa dianggap mencapai product-market fit pada Februari 2023 saat menjadi aplikasi konsumen dengan pertumbuhan tercepat dalam sejarah, tetapi saat itu belum mampu menghasilkan pendapatan yang nyata
  • Kombinasi agen coding dan kebijakan harga enterprise tampaknya menjadi titik ketika perusahaan-perusahaan ini mulai menghasilkan pendapatan yang sangat nyata

Fokus enterprise yang terlihat dari ekspansi perekrutan

  • Sinyal bahwa agen enterprise telah mencapai product-market fit juga terlihat dari lowongan kerja publik OpenAI dan Anthropic
  • OpenAI saat ini memiliki 703 lowongan, dan 229 di antaranya atau 32.6% diklasifikasikan sebagai peran terkait penjualan dan dukungan enterprise
    • Termasuk account executive, “Go To Market”, dan “Forward Deployed Engineers”
  • Anthropic memiliki 390 lowongan, dan 105 di antaranya atau 26.9% tampak berkarakter enterprise
  • Ada ironi bahwa laboratorium AI memilih model penjualan enterprise yang sangat bergantung pada kerja manusia
    • Kontrak penjualan enterprise membutuhkan banyak orang untuk bisa ditutup
  • Analisis perekrutan dilakukan dengan men-scrape situs lowongan menggunakan Claude Code, lalu memprosesnya melalui JSON API dari Datasette, Datasette Cloud, dan Datasette Agent; hasilnya dipublikasikan di gist

Kontroversi biaya yang dijadikan kisah kegagalan AI punya dasar lemah

  • Semakin banyak cerita bahwa perusahaan besar membunyikan alarm karena lonjakan biaya penggunaan AI, tetapi contoh yang sering dikutip tampak dilebih-lebihkan
  • Kasus Uber

    • Contoh yang paling banyak dibahas adalah laporan The Information yang menyebut CTO Uber Praveen Neppalli Naga mengatakan Uber “menghabiskan seluruh anggaran AI tahunan hanya dalam beberapa bulan pada 2026”
    • Sebagian besar kenaikan biaya disebut berasal dari Claude Code
    • Karena Claude Code benar-benar menjadi jauh lebih baik pada November 2025, tidak mengejutkan jika anggaran yang disusun pada 2025 gagal memprediksi permintaan tahun 2026
    • Pernyataan COO Uber Andrew Macdonald di podcast Rapid Response juga memperbesar kontroversi, tetapi isi bagian tersebut sebenarnya terbatas
    • Andrew Macdonald mengatakan 25% dari code commit pada kuartal sebelumnya dilakukan melalui Claude Code, tetapi sulit menghubungkan kenaikan produktivitas itu dengan apakah proyek yang sebelumnya dibatalkan jadi hidup kembali, atau apakah fitur yang berguna bagi konsumen benar-benar bertambah 25%
    • Pernyataan ini memicu headline seperti Business Insider: “AI tokenmaxxing spending semakin sulit dibenarkan”
  • Kasus Microsoft

    • Contoh populer lainnya adalah cerita bahwa Microsoft mulai mencabut lisensi Claude Code
    • Secara permukaan, langkah ini dimaksudkan untuk mendorong engineer agar langsung menggunakan agen Copilot CLI buatan internal
    • Tom Warren dari The Verge, mengutip sumber, mengatakan keputusan ini juga punya alasan finansial dan terkait dengan akhir tahun fiskal Microsoft pada 30 Juni
    • Kedua kasus ini lebih masuk akal dibaca bukan sebagai kegagalan AI, tetapi sebagai sinyal kelayakan harga: produk terasa mahal bagi pelanggan, namun tetap dipilih
    • Ini sejalan dengan pandangan bahwa harga produk yang bagus adalah harga yang membuat pelanggan menarik napas sejenak, lalu tetap berkata “ya”
    • Pembengkakan anggaran Uber dan pembatalan kursi di Microsoft tampaknya menunjukkan efek itu di dunia nyata

Skala pengeluaran laboratorium AI juga sangat besar

  • Laboratorium AI besar menghabiskan miliaran dolar untuk pelatihan maupun inferensi
  • Angka yang akurat dan dapat diandalkan memang jarang, tetapi SpaceX S-1 baru-baru ini memberi petunjuk besar terkait Anthropic
  • SpaceX mengungkapkan bahwa pada Mei 2026 mereka menandatangani Cloud Services Agreements dengan Anthropic PBC untuk menyediakan akses kapasitas komputasi COLOSSUS dan COLOSSUS II
    • Anthropic sepakat membayar SpaceX $1.25 miliar per bulan hingga Mei 2029
  • Dalam pengumumannya, Anthropic mengatakan perjanjian ini memungkinkan mereka “meningkatkan batas penggunaan Claude Code dan Claude API”
    • Ini dengan kuat menunjukkan bahwa Colossus digunakan untuk inferensi, bukan pelatihan model
  • Anthropic sendiri sudah mengamankan kapasitas komputasi sangat besar dari penyedia lain
    • Fakta bahwa mereka bersedia mengeluarkan tambahan $1.25 miliar per bulan hanya untuk kapasitas ekstra dari satu vendor menunjukkan betapa besarnya anggaran inferensi mereka sekarang

Pentingnya pendapatan API secara relatif menurun

  • Selama 2 tahun terakhir, OpenAI tampak memiliki porsi pendapatan langganan yang lebih besar, sedangkan Anthropic tampak lebih bergantung pada pendapatan API
  • Pendapatan API Anthropic secara historis sangat bergantung pada sejumlah kecil pelanggan API besar
    • Menurut laporan VentureBeat pada Agustus 2025, dua pelanggan yaitu Cursor dan GitHub Copilot menyumbang $1.2 miliar dari total pendapatan saat itu sebesar $4 miliar
  • Kini beredar rumor bahwa Anthropic akan mencapai pendapatan $10.9 miliar pada kuartal kedua dan mungkin untuk pertama kalinya menghasilkan laba operasional
  • Pergeseran ke enterprise mengisyaratkan bahwa laboratorium-laboratorium ini menilai ada lebih banyak uang dalam mengurangi perantara distribusi dan menjual langsung ke pelanggan
  • Claude Code milik Anthropic bersaing langsung dengan Cursor dan Copilot

April 2026 adalah titik belok baru

  • November 2025 adalah saat GPT-5.1 dan Opus 4.5, masing-masing dipadukan dengan harness agen codingnya, benar-benar menjadi cukup berguna untuk dipakai; ini bisa dilihat sebagai November inflection point
  • Dalam 6 bulan sesudahnya, perusahaan telah beradaptasi dengan sistem agen yang mampu melakukan pekerjaan berguna secara stabil
  • April 2026 tampaknya menjadi titik belok baru ketika dampak pendapatan dari perubahan teknologi itu mulai benar-benar terlihat
    • Menguntungkan bagi laboratorium frontier AI
    • Berdampak nyata pada anggaran perusahaan besar
  • Ketika dokumen S-1 untuk IPO Anthropic dan OpenAI nantinya dipublikasikan, kita mungkin bisa melihat hakikat momen ini melalui angka yang sudah diaudit

1 komentar

 
GN⁺ 4 jam lalu
Pendapat Hacker News
  • Dalam 5 tahun ke depan, mereka harus mendapatkan kembali 5–10 triliun dolar; jika gagal, mereka akan mulai menyusutkan ekspansi perangkat keras
    Itu berarti dibutuhkan lebih dari 1 triliun dolar per tahun untuk pengeluaran token. Jika dihitung berdasarkan 200 juta pekerja pengetahuan di seluruh dunia dan 30 juta developer, itu berarti dunia di mana 5% dari gaji semua pekerja pengetahuan, atau 20% jika developer, harus masuk ke token
    Di sekitar saya, orang-orang bilang alat seperti ini benar-benar meningkatkan kecepatan 20–40% pada pekerjaan yang benar-benar diperhatikan perusahaan. Jika kecepatannya naik 20% dengan pengeluaran naik 20%, sulit membenarkan pengeluaran tahunan 1 triliun dolar
    Kita masih belum sampai ke sana. Sekarang masih berada di fase naik dari siklus hype, dan kalau ini tidak bisa membuat developer 2x, 5x, atau 10x lebih produktif dalam pekerjaan penting, tampaknya arahnya tidak akan bagus

    • Ada beberapa pemikiran. Dari informasi yang dipublikasikan, hubungan antara biaya inferensi dan biaya pelatihan tampak saling bertentangan
      Para insinyur listrik yang terlibat dengan pusat data berbicara seolah lonjakan penggunaan daya saat pelatihan adalah faktor utama dalam desain, tetapi makalah yang membahas scaling optimal biaya dengan yakin memperlakukan komputasi saat inferensi sebagai faktor besar
      Salah satu dasar untuk pandangan bahwa pelatihan, bahkan setelah diamortisasi, jauh lebih intensif komputasi daripada inferensi adalah bahwa penyedia dari Tiongkok yang sangat dibatasi akses sumber daya komputasinya menawarkan token nyaris tak terbatas dengan harga lebih rendah, tetapi performa modelnya lebih buruk. Ini masuk akal jika ditafsirkan bahwa perusahaan AS menaikkan biaya inferensi 20–30x karena biaya pelatihan yang diamortisasi yang tidak mampu ditanggung pemain luar negeri
      Jika biaya pelatihan jauh lebih besar daripada inferensi, mereka berada dalam prisoner’s dilemma yang jauh lebih parah daripada model kompetisi biasa dengan biaya marginal nol. Sebaliknya, jika biaya inferensi lebih besar, maka analisis bahwa ini adalah bisnis mirip utilitas seperti yang dikatakan sebagian pemikir mungkin benar. CEO punya insentif sangat besar untuk mengatakan demikian. Jika alternatifnya, yaitu prisoner’s dilemma, terungkap, investasi bisa berhenti sangat cepat
      Yang sedikit banyak menyentuh fakta hanyalah rumor dari para insinyur fasilitas; sisanya lebih mirip analisis tingkat tinggi dan manajemen ala meja kerja terhadap bisnis yang serba rahasia. Ini menunjukkan tingkat pemahaman saat ini
      Jika kita bahkan tidak tahu rasio antara belanja modal yang diamortisasi dan biaya operasional, analisis investor eksternal itu mustahil. Sedetail apa pun akuntansi soal tanaman kantor dan tanaman indoor, itu tidak berarti jika bagian terbesar bisnis ini tertutup rahasia dagang
    • Saya bekerja di perusahaan yang sangat kecil dengan pendapatan tahunan 150 juta dolar dan margin laba bersih 9%, dan karena bagi kami itu sudah cukup bagus, kami sudah mempertimbangkan mengeluarkan 100 ribu dolar untuk perangkat keras agar bisa menjalankan model lokal
      Perkiraan pengeluaran untuk AI-as-a-service akan melampaui biaya itu bahkan sebelum 1 tahun
      Dalam beberapa tahun, tampaknya akan ada perangkat keras yang cukup terjangkau bahkan untuk perusahaan sangat kecil, untuk menjalankan model frontier yang cukup bagus untuk sebagian besar pekerjaan
    • Mungkin pengamatan tiap orang berbeda, tetapi pengamatan saya juga tidak jauh beda. Hanya saja itu perspektif dari bawah ke atas. Pada titik ini, bukankah seharusnya kita juga sudah bisa melihatnya dari atas ke bawah?
      Jika kita sudah melewati tahap potensi dan masuk ke peningkatan produktivitas yang bermakna, kenapa itu tidak muncul di angka-angka pelanggan?
      Kenapa Delta Airlines tidak secara drastis meningkatkan efisiensi operasionalnya dalam 3 bulan terakhir karena adopsi software yang lebih baik?
      Saya benar-benar penasaran. Terlihat ada diskoneksi
    • Saya masih ingat jelas sesuatu yang dikatakan profesor ekonometrika saya saat kuliah pada akhir 1990-an hingga awal 2000-an
      Ketika TV kabel dan Pay Per View muncul, ada penelitian tentang seberapa banyak film yang akan ditonton orang jika mereka punya akses tanpa batas, dan hasilnya beredar seolah-olah itu bukti bahwa semua infrastruktur untuk mendukung bisnis ini harus dibangun. Namun ketika para ahli statistik menganalisis data lebih jauh, kesimpulannya adalah bahwa orang menjawab mereka akan menonton film setiap hari, 7 hari seminggu, 10–12 jam sehari. Angka yang mustahil
      Sekarang rasanya seperti berada di perahu yang sama. Sebagian orang berasumsi semua orang akan memakai token semaksimal mungkin, dan harga token tidak akan pernah turun meskipun ada perbaikan pada perangkat keras, software, desain, dan tekanan pasar
    • Salah satu faktor yang perlu dipertimbangkan adalah bahwa populasi dasar itu tidak akan tetap sama selama 5 tahun ke depan
      Setiap generasi alat developer telah meningkatkan throughput kode absolut sambil menciptakan lapisan developer baru dan pengguna baru
      Sudah selalu begitu, dari compiler pertama, melewati era framework, hingga sekarang, dan tingkat keahlian yang dibutuhkan untuk menjadi developer terus turun. Pada pertengahan hingga akhir 1980-an, aplikasi bisa ditulis oleh ilmuwan komputer level S2/S3, lalu turun ke mahasiswa S1 dan insinyur TI, teori ilmu komputer sebagian besar menjadi opsional, lalu turun lagi ke lulusan universitas dengan sedikit pelatihan, dan kini bergerak lebih jauh melalui alat no-code/low-code seperti retool sebelum 2022 hingga layanan generasi kode agen seperti v0/Replit
      Generasi developer berikutnya tidak akan membangun aplikasi dan arsitektur seperti generasi sebelumnya. Sebagian besar orang di sini juga mungkin tidak akan membangunnya pada tingkat kualitas seperti saat pg membuat platform ini, tetapi itu tidak masalah jika pengguna tetap menemukan nilai. Banyak aplikasi enterprise dengan kualitas menengah sudah membuktikan itu
      Pada akhirnya, logika bisnis ini adalah bahwa angka 200 juta/30 juta itu tidak akan tetap sama. Saya juga tidak yakin perubahan itu akan cukup besar dan cukup cepat untuk membenarkan belanja modal ini. Namun, Web 1, Web 2.0, SaaS, dan revolusi mobile juga menciptakan lapisan pengguna dan developer baru dengan cukup cepat, jadi itu tidak sepenuhnya tidak realistis
      [1] HN adalah outlier kuat karena merupakan implementasi Lisp kustom, tetapi di era sebelumnya ada banyak contoh arsitektur yang lebih kokoh meski pilihannya lebih moderat, dan tingkat keahlian seperti itu mungkin sulit ditemukan pada generasi pendiri saat ini
  • Analisis ini membingungkan. Product-market fit (PMF) untuk sisi coding kemungkinan besar sudah tercapai sejak tahun lalu. Profitabilitas adalah masalah terpisah dan masih belum jelas
    Tulisan ini mencampuradukkan keduanya tanpa menyajikan argumen ekonomi yang kuat atau angka yang meyakinkan. Saya juga tidak paham kenapa kasus Uber relevan. COO Uber sendiri dengan jelas mengatakan bahwa setidaknya dari sudut pandang ROI, hasilnya belum terlihat
    Menurut saya, produknya sudah sangat berguna untuk coding sejak beberapa bulan lalu. Tapi jelas tidak berguna pada biaya berapa pun

    • Yang membingungkan adalah orang-orang tampaknya mengabaikan trajektori. Padahal itu mungkin bagian yang paling penting, tetapi malah tenggelam
      Seperti kata Simon, baru 6 bulan sejak agen coding yang “cukup bagus” muncul, dan itu cuma sekejap mata. Namun di perusahaan kami, pekerjaan saya sudah berubah total dan rasanya hampir seperti mimpi
      Dan itu baru satu titik belok. Sudah ada beberapa titik belok, dan masih banyak lagi di depan. Saya bisa menerima argumen bahwa bahkan dengan pengeluaran perusahaan yang tidak masuk akal hari ini, ROI mungkin belum positif, tetapi menyiapkan jalan dari sekarang untuk apa yang akan datang dalam beberapa bulan, apalagi beberapa tahun, sepenuhnya masuk akal
    • PMF adalah konsep yang aneh, didefinisikan seolah-olah “kalau tidak yakin ada, berarti tidak ada”
      Bagi orang-orang yang sudah meluangkan waktu untuk memakainya dan memahaminya, ini sudah jelas berguna sejak beberapa bulan lalu, tetapi sekarang pengetahuan itu telah menyebar sampai ke orang-orang yang memegang dompet dan membuat mereka yakin bahwa ini bukan sekadar tren atau hype, sehingga PMF sekarang bisa “diklaim”
      Tapi saya setuju bahwa mengatakan “mereka punya PMF” itu terdengar aneh. Biasanya itu konsep yang didefinisikan untuk produk sendiri
    • Benar. Biaya juga bagian dari ekonomi
      Karena itu, banyak orang di sini sebaiknya tidak ikut dalam diskusi ini. Mereka hanya mengulang-ulang manfaat tanpa mengidentifikasi dan menjelaskan biaya serta bagaimana biaya itu memengaruhi kondisi keuangan perusahaan
    • Tulisan ini memberi beban terlalu besar pada kata “bagus”, jadi saya jadi meragukan analisanya
      “Alasan kami menyebut November 2025 sebagai titik belok November adalah karena GPT-5.1 dan Opus 4.5 menjadi lebih baik ketika digabungkan dengan harness agen coding masing-masing. Keduanya menjadi cukup bagus untuk secara andal menyelesaikan pekerjaan yang berguna, dan kami telah beradaptasi dengan sistem agen selama 6 bulan terakhir”
    • Ini memang bukan tulisan yang dimaksudkan untuk logis. Ini lebih mirip blog penginjilan LLM, dan hampir tidak ada analisis kritis yang tidak ramah terhadap industrinya
      Kalau membaca tulisan lainnya juga, hampir tidak ada skeptisisme; isinya lebih banyak promosi tentang betapa hebatnya semua ini
  • Tulisan ini terasa agak seperti psikosis AI
    “Alat-alat ini memang membakar jauh lebih banyak token, tetapi dengan cepat menjadi alat sehari-hari untuk pekerjaan yang dilakukan para profesional dengan bayaran sangat tinggi”
    “Entah bagaimana potongan ini berubah menjadi headline seperti ‘COO Uber mengatakan semakin sulit membenarkan pengeluaran token AI yang berlebihan’, karena pasar untuk kisah kegagalan AI masih sangat besar”
    Ya, tentu, ini pasti cuma keinginan agar AI gagal. Tidak mungkin yang terjadi adalah pembengkakan biaya, pendapatan rekor, dan PHK besar-besaran. Juga tentu tidak mungkin bahwa orang-orang yang sudah bergaji tinggi ini membakar uang dengan alat-alat tersebut sambil sama sekali tidak menghasilkan peningkatan “nilai”. Saya akui output-nya 100x, tetapi hasil akhirnya datar di semua metrik
    [1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
    [2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...

    • Yang dimaksud psikosis itu tepatnya apa?
  • Jika GLM-5.1 sama bagusnya, open source, dan jauh lebih murah, bagaimana rencana OpenAI dan Anthropic untuk mempertahankan pelanggan?
    Model bisnisnya tampaknya tidak akan berjalan. Seorang teman dekat bekerja langsung di perangkat lunak otomasi untuk perusahaan besar, dan sama sekali tidak memakai Claude atau OpenAI
    Untuk pekerjaan penalaran berat, dia terutama memakai gpt 120b dan GLM-5.1 di atas Cerebras, dan untuk berbagai tugas lain memakai model-model kecil yang berbeda. Semuanya open source
    Sistem-sistem ini sangat berguna bagi perusahaan, dan bisa menjalankan pipeline otomatis penuh yang sangat stabil dan cepat
    Kami sering membicarakan topik ini, dan kami berdua merasa perusahaan yang melakukan pekerjaan agen berat dengan Claude dan OpenAI tampaknya tidak benar-benar menyadari seberapa bagus dan murah open source telah berkembang selama setahun terakhir
    Jadi ketika perusahaan dan developer yang sudah mapan berhasil mengejar, bukankah Claude dan OpenAI tidak akan bisa menutup biayanya?

    • GLM-5.1 tidak berada di level yang sama. Ia bukan tandingan Opus milik Claude Code. Coba saja sendiri. Model open source setidaknya tertinggal sekitar 1 tahun
    • Setuju bahwa model bisnisnya tidak terlihat. Dari sudut pandang 5 Forces Porter, ini seperti mimpi buruk
      Akan ada sangat banyak perusahaan yang bersaing di ruang ini, dan meskipun sifatnya padat modal memberi semacam moat, pada akhirnya praktis akan ada pesaing yang nyaris tak terbatas
      Ini bagus untuk konsumen
    • Untuk coding, Anda harus selalu memakai model terbaik di bidang itu saat ini, bukan model yang mungkin akan menjadi yang terbaik jika kembali ke setahun lalu. GLM 5.1 tepat berada di posisi itu
      Ini saya katakan sebagai penggemar besar GLM yang memakai model itu untuk situs terjemahan karena price/performance-nya cukup baik
      Saat ini sebagian besar uang ada di coding. Jika OpenAI dan Anthropic hanya unggul 6 bulan dari model open source terdepan, mereka tetap bisa merebut sebagian besar pasar perusahaan dan developer
    • Untuk bantuan coding, saya sudah mencoba beberapa model open besar di OpenCode lewat OpenRouter, dan semuanya terasa cukup buruk dibanding Claude Opus
      Bisa beri petunjuk bagaimana menanganinya agar mendapatkan lebih banyak nilai dari model open?
      Saya setuju dengan pernyataan umum bahwa model open tertinggal sekitar 1 tahun. Tetapi sekitar 1 tahun lalu terjadi semacam keajaiban ketika model terdepan menjadi sangat berguna. Dengan logika ini, model open seharusnya segera bekerja dengan baik juga, tetapi saya khawatir ada sesuatu selain sekadar menunggu bumi berputar sekali lagi
      Sebagai konteks, use case saya adalah bantuan coding. Untuk tujuan lain, model open mungkin luar biasa
    • Bukankah untuk menjalankan model-model yang “sebagus model frontier” ini Anda harus mengeluarkan sekitar $5 ribu~$10 ribu?
      Saya belum pernah melihat analisis yang benar-benar meyakinkan tentang ROI menjalankan model coding sendiri, terutama dibanding paket $20 atau $200 per bulan
  • Frasa “token senilai $2,180.16 dengan $200” terdengar aneh
    Token tidak punya biaya atau nilai intrinsik. Mengatakan Anda memakai token senilai $2,180.16 mirip dengan percaya pada sales yang meyakinkan Anda bahwa satu set panci seharga $19.99 bernilai $1 miliar
    Lucu melihat orang membuang pemikiran kritis ke luar jendela saat menilai sumber yang bias

    • Saya kurang paham Anda sedang membantah apa di sini
      Saya menghabiskan $200. Kalau dibayar dengan harga API, biayanya akan menjadi $2,180.16. Tulisan itu membahas pelanggan perusahaan yang membayar harga API, jadi maksudnya jika saya dipekerjakan di perusahaan seperti itu, saya akan menimbulkan biaya $2,180.16 untuk perusahaan
      Apa yang saya lewatkan?
    • Token jelas punya biaya intrinsik yang bisa dihitung. Ada biaya marjinal produksi, yaitu biaya inferensi, dan ada juga biaya R&D yang diamortisasi yang masuk ke model yang menghasilkan token tersebut
      Nilainya memang sulit dihitung, tetapi untungnya mekanisme harga pasar memang ada untuk tujuan itu. Tidak ada angka yang lebih baik daripada harga yang orang bersedia bayar
      Jadi maksudnya adalah di paket perusahaan, Anda akan menghabiskan $2,180.16. Orang itu sendiri tidak membayar sebanyak itu, tetapi perusahaan membayarnya
    • Dari perhitungan kasar untuk proyek saya, membayar per token di OpenRouter kadang kompetitif atau bahkan lebih murah daripada menjalankan model open weight yang sama di GPU sewaan
      Harga per token untuk model frontier tertutup dan model open weight berada di kisaran yang mirip, yaitu sen hingga dolar per juta token. Bagi saya, harga ini tampak sebagai sinyal bahwa angka tersebut cukup berpijak pada realitas
    • Kalau dipikir sedikit lebih kritis, kalimat itu terbaca sebagai “token senilai $2,180 berdasarkan harga API saat ini”
    • Tentu saja ada biaya intrinsik. Batas bawahnya adalah tagihan listrik. Benar-benar lucu melihat orang membuang pemikiran kritis saat menilai sumber yang bias
  • Timing yang sebenarnya adalah bahwa saat ini permintaan untuk bisnis baru yang kuat sedang kurang, dan karena kita sudah mengumpulkan cukup banyak aset teknis, pekerjaan makin lama makin menjadi pekerjaan inkremental
    Artinya kita bisa membangun fitur yang stabil di atas tumpukan pekerjaan lama yang sangat besar, dan di situlah AI sangat menonjol. Jadi terlepas ada AI atau tidak, jika sebagian besar pekerjaan hanyalah menambah satu fitur, memperbaiki satu bug, atau sedikit menyesuaikan konfigurasi, perusahaan memang akan merekrut lebih sedikit software engineer. AI hanya mempercepat tekanan itu
    Sebaliknya, bayangkan jika AI yang sama sudah ada 20 tahun lalu. Saat orang masih berusaha memahami JAX-RS, apakah AI benar-benar bisa menggunakan Jersey? Ketika React baru saja ditemukan, apakah AI bisa menjawab semua pertanyaan tentang React? Apakah jumlah orang yang dibutuhkan untuk membangun seluruh infrastruktur public cloud atau yang disebut platform big data bisa dipangkas menjadi sepersepuluh? Saat itu semuanya berkembang sangat cepat, jadi kemungkinan besar dibutuhkan banyak engineer untuk mengeksplorasi begitu banyak kemungkinan. Saya juga sangat ragu AI bisa membangun ekosistem machine learning hanya dengan sepersepuluh tenaga kerja. Dua puluh tahun lalu R masih dominan, dan ekosistem Python sama sekali belum matang. Hal yang sama berlaku untuk mobile computing; apakah AI akan memangkas menjadi sepersepuluh jumlah orang yang dibutuhkan untuk membuat semua aplikasi mobile dan infrastruktur dasarnya?

    • Untuk “apakah AI bisa menjawab semua pertanyaan tentang React?”, saya rasa iya karena in-context learning (ICL)
      Untuk “apakah infrastruktur public cloud atau platform big data bisa dibangun dengan sepersepuluh tenaga kerja?”, saya rasa tidak. AI tidak bisa menyelesaikan masalah intinya, dan saat skala membesar hasilnya jadi berantakan
      Soal pekerjaan inkremental, itu benar. Hanya saja, secara historis sebagian besar pekerjaan memang selalu inkremental, dan posisi R&D menurut saya selalu minoritas
  • Harus mengakui apa adanya. Semua ini adalah penipuan terbesar dalam sejarah
    AI memang punya kasus penggunaan yang berguna, tetapi bukan pada harga saat ini. Saya sudah memakai AI bersama cukup banyak heavy user sejak era GPT-2. Semua pengguna mengatakan hal yang sama. Rasa ingin tahu, keterkejutan, hype, kebencian, pencerahan. Perusahaan biasanya sedikit terlambat, dan sekarang kita sedang berada di siklus hype. Tepat di titik itulah semua kontrak dijual dan IPO dilakukan
    Benar-benar langkah ala buku teks VC
    Yang jangan disalahpahami adalah bahwa AI memang punya contoh penggunaan yang berguna. Hanya saja bukan seperti yang mereka inginkan. Mirip sekali dengan blockchain. Gagasan mata uang terdesentralisasi memang layak untuk ada. 99% koin lainnya tidak
    AI adalah mesin pencari yang lebih cepat tetapi tetap kurang akurat. Sangat bagus untuk mencari bug dan juga bagus untuk rubber duck debugging
    Saya menyebutnya penipuan karena, bersama pemasarannya, ini memberi kesan kepada banyak orang di seluruh dunia bahwa sekarang mereka bisa membuat startup, game, infrastruktur, dan sebagainya tanpa perlu belajar sendiri. Akibatnya lahirlah jutaan proyek dan produk berkualitas rendah yang terbengkalai. Mayoritas tidak pernah membangun mental model yang dibutuhkan untuk benar-benar menyelesaikan masalah secara tuntas. Pada akhirnya mereka membuang waktu berbulan-bulan dan uang, sambil hanya membakar token. Itulah yang saya sebut penipuan
    Semua early adopter yang saya kenal telah sangat mengurangi penggunaan, bukan karena uang tetapi karena tidak ada kasus penggunaan baru. Saat menjelajahi proyek baru, cukup lakukan onboarding dengan cepat, pelajari banyak hal, lalu beralih ke dokumentasi dan pengujian nyata. Penggunaan saya sekarang adalah yang terendah dalam dua tahun terakhir
    Saya tidak akan membiarkan AI menyentuh kode saya. Saya khawatir itu akan merangkak naik lagi. Sebaliknya, saya membiarkannya membaca kode saya dan memberi tahu apa yang saya lakukan salah supaya saya bisa mengasah diri sendiri
    Ratusan perusahaan, termasuk solusi open source, bisa menyediakan sampai di situ
    Teman-teman nonteknis saya semua sedang berada di siklus hype sekarang, dan mereka membagikan kepada saya antusiasme yang akan datang beserta kekecewaan yang bisa diprediksi
    Dalam satu sisi, mengesankan juga bahwa AI, baik secara sadar maupun tidak sadar, dimanfaatkan dengan sangat bergaya VC seperti ini sehingga berhasil menciptakan perusahaan-perusahaan raksasa di depan mata seluruh dunia

    • Bisa bantu saya merapikan argumen awalnya?
      Maksudnya ini penipuan karena ROI model coding yang memakai token tidak positif? Misalnya, tidak menghasilkan nilai yang cukup untuk layak ditagih $100 per bulan?
      Maksudnya pelanggan perusahaan tidak cukup pintar untuk melihat ini?
      Pada akhirnya ini semacam fatamorgana ala blockchain, lalu IPO dilakukan untuk memaksimalkan keuntungan CEO?
      Apakah saya memahaminya dengan benar, atau saya malah menjejalkan kata-kata ke mulut Anda?
      Soal bagian “memberi kesan kepada orang-orang bahwa sekarang mereka bisa membuat startup, game, infrastruktur mereka sendiri tanpa perlu belajar sendiri”, bukankah itu strawman, meski kita tidak bisa memastikan keyakinan dan motivasi orang? AI adalah alat yang kuat untuk mengamplifikasi manusia. Anda tidak bisa sekadar memasukkan prompt seperti “tolong buatkan aplikasi enterprise SaaS senilai 1 miliar dolar” atau “tolong buatkan GTA6, jangan berhalusinasi”. Tetapi apakah memang ada kesan bahwa hal seperti itu benar-benar sedang terjadi? Apakah Dario dan Sam mengatakan “beli langganan coding agent kami dan Anda bisa membuat game sekaligus jadi kaya tanpa kemampuan teknis”?
      Tidak merasakan nilai dari AI agent hari ini jelas sangat mungkin. Bisa juga memang terasa mengganjal. Tetapi menyebutnya penipuan setara blockchain menurut saya bertentangan dengan sinyal-sinyal besar yang ada, serta percakapan nyata tentang apa yang sistem-sistem ini bisa lakukan hari ini dan apa yang diharapkan bisa mereka lakukan menjelang akhir tahun ini
  • Dari yang saya baca, Anthropic sebenarnya tidak benar-benar profitabel, dan tampaknya hanya sempat terlihat untung karena diskon. Tulisan ini menyampaikan argumen itu dengan baik: https://www.wheresyoured.at/anthropics-profitability-swindle...
    Saya juga skeptis apakah kenaikan harga saat ini sudah cukup, dan apakah sebagian besar pengguna serta perusahaan akan menerima kenaikan harga yang lebih besar yang akan dibutuhkan nanti. Terutama untuk pengguna individu, $200 per bulan sudah sangat mahal, dan saya rasa kebanyakan orang tidak akan membayar harga seperti $1.000 per bulan

  • Untuk berita terkait LLM, sepertinya perusahaan-perusahaan ini sebaiknya diabaikan saja sampai setelah mereka IPO. Banyak bot yang membentuk opini positif

  • $200 per bulan per seat itu bukan apa-apa
    Satu paket lisensi 3D CAD yang dipakai orang-orang di grup R&D kami biayanya ribuan dolar per bulan per seat
    Sudah waktunya software seat juga mendapat cinta

    • AutoCAD harganya $175 per bulan per pengguna [1]
      [1] https://www.autodesk.com/products/autocad/buy
    • Betul, itu bukan apa-apa, tetapi itu juga bukan biaya yang benar-benar dibayar perusahaan. Seperti tertulis di artikel, harganya adalah $20 per bulan per seat ditambah biaya penggunaan API per token
      Perusahaan membayar penagihan berbasis penggunaan, bukan “prasmanan tak terbatas” dari paket tarif tetap
    • Lisensi CATIA termahal yang pernah saya lihat pun sekitar $600 per bulan per pengguna. Anda melihat “ribuan dolar” per seat itu dari mana?
    • Kalau gaji engineer ikut dihitung, Anda akan sadar bahwa software seat itu sudah lebih mahal daripada seat R&D tersebut
    • Apakah CAD akan menjadi alat yang dipakai semua pekerja?