12 poin oleh GN⁺ 2025-08-22 | 1 komentar | Bagikan ke WhatsApp
  • Menurut laporan MIT, 95% perusahaan di seluruh dunia tidak memperoleh keuntungan nyata dari adopsi AI generatif
  • Perusahaan telah bereksperimen secara besar-besaran dengan model bahasa besar seperti ChatGPT dan Copilot, tetapi sebagian besar pemanfaatannya hanya sebatas peningkatan produktivitas
  • Kasus sukses hanya terkonfirmasi pada 5% pilot AI terintegrasi, dan sebagian besar tidak berdampak pada pendapatan maupun laba
  • Penyebab utamanya adalah AI generatif sering tidak selaras dengan prosedur kerja nyata, tidak dapat mengingat umpan balik, dan gagal beradaptasi dengan konteks
  • Laporan tersebut menepis kekhawatiran soal penggantian pekerjaan secara besar-besaran, dan menganalisis bahwa penghematan biaya eksternal memang mungkin terjadi, tetapi perombakan struktur internal atau PHK massal masih belum realistis untuk sementara waktu
  • Kesimpulannya, AI lebih unggul untuk tugas-tugas tertentu daripada sebagai strategi, dan perusahaan disarankan fokus pada area yang terbatas dan bisa menghasilkan dampak langsung, alih-alih inovasi menyeluruh di seluruh perusahaan

Investasi dan keuntungan AI generatif di perusahaan

  • Dalam 3 tahun terakhir, perusahaan telah menginvestasikan $30–40 miliar ke proyek AI generatif
  • Namun, hanya sangat sedikit perusahaan yang memperoleh keuntungan bisnis nyata
  • Menurut penelitian baru dari MIT, 95% perusahaan menjawab bahwa mereka tidak melihat manfaat terukur meski telah mengadopsi AI
  • Hanya 5% proyek pilot AI yang menciptakan nilai senilai jutaan dolar

Status adopsi model bahasa besar dan keterbatasannya

  • Lebih dari 80% perusahaan besar telah menguji atau menjalankan pilot LLM utama seperti ChatGPT dan Copilot
  • Sekitar 40% perusahaan telah mengadopsi sistem tersebut sampai tingkat tertentu, tetapi sebagian besar masih terbatas pada peningkatan produktivitas pribadi karyawan
  • Hampir tidak ada dampak terhadap peningkatan total pendapatan atau laba perusahaan

Keterbatasan teknis AI generatif

  • Alat AI generatif sering kali tidak cocok dengan proses kerja nyata
    • Masalah utamanya meliputi workflow yang tidak stabil, tidak adanya pembelajaran konteks, dan keterhubungan kerja yang tidak efisien
  • Sebagian besar model AI generatif tidak mampu mempertahankan umpan balik masa lalu dan sulit mentransfer pelajaran antar konteks maupun tugas
  • Menurut laporan tersebut, sebagian besar sistem GenAI tidak mampu mempertahankan umpan balik, beradaptasi dengan konteks, atau melakukan perbaikan jangka panjang
  • Karena karakteristik ini, biaya integrasi jangka panjang di dalam perusahaan justru meningkat, sementara efisiensi nyata masih minim

Kesenjangan antara ekspektasi bisnis dan kenyataan

  • Ekspektasi dan skala investasi pada AI generatif sangat besar, tetapi belum berujung pada penghematan biaya atau penciptaan keuntungan nyata
  • Dalam praktiknya, AI generatif dipakai untuk tugas terbatas seperti layanan pelanggan, pemasaran, dan penulisan dokumen; memang menghemat waktu, tetapi efek langsung pada peningkatan pendapatan kecil

Dampak terhadap lapangan kerja dan struktur organisasi

  • Kekhawatiran bahwa AI generatif akan menyebabkan pengurangan pekerjaan besar-besaran dalam jangka pendek dinilai lemah dasar buktinya
  • Dampak AI diperkirakan lebih berupa optimalisasi biaya eksternal seperti pengurangan biaya outsourcing, bukan perubahan besar pada struktur tenaga kerja internal
  • Alih-alih segera menggantikan tenaga kerja dalam skala besar, dampaknya kemungkinan hanya sebatas menekan biaya alih daya

Kesalahpahaman teknis dan batas perkembangan

  • Banyak kegagalan terjadi karena perusahaan tidak memahami secara akurat kemampuan nyata dan keterbatasan AI
  • AI generatif memang dapat membuat teks atau kode dengan cepat, tetapi tidak memiliki pembelajaran berkelanjutan atau fleksibilitas seperti manusia
  • Sebagai contoh, karyawan bisa menyesuaikan diri secara luwes berdasarkan kesalahan sebelumnya atau kebutuhan baru, tetapi AI tidak mampu melakukan transfer memori berkelanjutan semacam itu

Investasi dan arah ke depan

  • Investor dan eksekutif berharap teknologi AI terus berkembang, tetapi dalam jangka pendek kemajuannya lebih lambat dari perkiraan
  • Laporan ini menunjukkan bahwa menerapkan AI secara langsung ke semua industri dan workflow masih terlalu dini
  • Organisasi perlu memusatkan adopsi pada bidang sempit yang dapat menghasilkan dampak langsung dan terukur
    • Contoh: otomatisasi dukungan pelanggan, alat bantu pengembangan, dan penyusunan draf dokumen
  • Integrasi AI di seluruh perusahaan masih berisiko tinggi dan memiliki kemungkinan gagal yang besar

Kesimpulan dan implikasi

  • Realisasi nilai perusahaan dari AI generatif masih terbatas pada beberapa kasus sukses saja
  • Sebagian besar perusahaan hanya memperoleh bantuan kecil dalam pekerjaan sehari-hari
  • Laporan tersebut menekankan bahwa perusahaan perlu memandang AI generatif sebagai alat yang terbatas, bukan mesin pertumbuhan menyeluruh
  • Ekspektasinya tinggi, tetapi selama sistem saat ini belum bisa beradaptasi seperti manusia, perusahaan akan sulit memperoleh keuntungan besar dari AI

1 komentar

 
GN⁺ 2025-08-22
Opini Hacker News
  • Ada diskusi duplikat minggu ini (162 komentar) https://news.ycombinator.com/item?id=44941118 dan laporan sumber asli yang tidak ditautkan oleh artikel tersebut adalah https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • Disebutkan bahwa laporan tersebut sama sekali berbeda dari isi artikelnya, jadi saya ingin membagikan beberapa poin: 50% dari anggaran yang gagal dipakai untuk marketing dan sales, AI tampaknya bisa mengotomatisasi nilai tenaga kerja sebesar 2,3 triliun dolar, berdampak pada 39 juta posisi, dan penyebab utama kegagalan yang ditekankan adalah penolakan terhadap adopsi alat baru serta kurangnya dukungan manajemen. Menurut saya orang terlalu cepat menyimpulkan bahwa AI tidak bekerja. Bukan itu yang dikatakan laporan tersebut.
    • Disebutkan bahwa "AI mengotomatisasi nilai tenaga kerja 2,3 triliun dolar dan berdampak pada 39 juta posisi", tetapi saat ini potensi otomasi nilai tenaga kerja di AS hanya 2,27%. PDB AS saat ini 27 triliun dolar, jadi klaimnya adalah dengan mengoptimalkan nilai tenaga kerja AS sebesar 61 miliar dolar sambil menggantikan sekitar 15% tenaga kerja AS, itu akan menghasilkan nilai 2,3 triliun dolar. Saya ragu hitungannya benar. Saya juga penasaran siapa yang akan membeli semua itu jika bukan para pekerja. Investasi AI pada 2025 sudah melampaui setengah angka tersebut. Dalam situasi seperti ini, saya tidak tahu bagaimana "nilai tenaga kerja" seharusnya diukur. PDB tampaknya bukan metrik yang cocok.
    • Kesan saya juga sejalan dengan laporan itu. Sebagian berita hanya mendorong narasi sensasional demi klik. Mereka salah paham secara serius terhadap isi laporan sebenarnya. Ini bukan kegagalan AI, melainkan lebih karena karyawan saat ini tidak benar-benar mengadopsi alat tersebut, atau setidaknya tidak mengadopsi alat yang disediakan perusahaan. "Ekonomi shadow AI" yang mereka sebutkan juga masalah nyata. Orang-orang memakai langganan LLM pribadi alih-alih alat yang disediakan perusahaan. Universitas kami juga menyediakan ChatGPT Enterprise untuk semua mahasiswa dan staf, tetapi itu jauh tertinggal dibanding versi cloud terbaru seperti GPT-5. Karena itu tingkat adopsi sistem dan retensi pengguna rendah. Untuk sebagian besar use case, memakai cloud berarti menggunakan data yang tidak ilegal untuk dipakai, jadi kendalanya tidak terlalu banyak.
    • Bagian ini sangat berkesan di laporan: seorang pengacara di firma hukum menengah membeli alat analisis kontrak senilai 50.000 dolar untuk perusahaannya, tetapi dalam praktik tetap memakai ChatGPT. Alat AI yang dibeli perusahaan terlalu kaku saat merangkum dan sulit dikustomisasi, sementara ChatGPT memungkinkan percakapan untuk secara iteratif menghasilkan hasil yang diinginkan. Jadi ada paradoks bahwa alat seharga 20 dolar jauh lebih baik daripada solusi enterprise bernilai puluhan juta won dari sisi kepuasan pengguna nyata. Karena itulah banyak perusahaan berada di sisi yang salah dari GenAI divide.
    • Angka 39 juta posisi yang terdampak benar-benar mengejutkan. Populasi pekerja di AS adalah 163 juta, jadi itu berarti hampir seperempatnya berisiko.
    • Menanggapi komentar "banyak orang terlalu cepat menyimpulkan bahwa AI tidak berguna", saya membagikan kutipan terkenal: "Sulit membuat seseorang memahami sesuatu ketika gajinya bergantung pada ketidakpahamannya."
  • Saya saat ini memimpin tim AI engineering, jadi tentu persepsi bahwa AI menciptakan nilai sesuai dengan kepentingan saya. Di perusahaan kami, penerapan AI memungkinkan penghematan jutaan dolar. Kami mengoperasikan call center besar, dan dulu karyawan menulis ringkasan manual 3-5 menit untuk tiap panggilan. Baru-baru ini kami mengotomatisasi ringkasan panggilan dengan AI. Kualitas ringkasannya juga lebih baik, dan orang bisa fokus pada pekerjaan yang lebih bernilai. Ini bukan sesuatu yang revolusioner, tetapi peningkatan efisiensi yang nyata dan bisa diukur.
    • Tip kecil: saya menyarankan agar ringkasan tidak dibuat sama sekali dan hanya dibuat saat materi itu benar-benar dibutuhkan. Audio panggilan bisa disimpan dalam Opus 24Kb/s dengan ukuran 180KB per menit, lalu dihapus setelah jangka waktu tertentu; ini bisa menghemat jutaan dolar tambahan per tahun.
    • Perusahaan kami membuat transkrip rapat dengan Google Meet dan Gemini. Namun hasil nyatanya sangat tidak akurat. Sering bingung siapa yang mengatakan apa, kadang malah membalik makna, dan tidak punya konteks. Sistem itu juga tidak memahami istilah internal kami, jadi pada praktiknya nyaris tidak bisa dipakai.
    • Saya penasaran apakah staf call center benar-benar merasa ringkasan AI lebih baik daripada yang mereka buat sendiri. Dalam kasus saya, saya rasa ini sulit dipakai untuk ringkasan rapat. Sepertinya ini hanya bekerja baik untuk panggilan satu arah.
    • Kami juga pernah mencoba AI untuk ringkasan rapat, tetapi hasilnya terlalu buruk sehingga kami kembali menulisnya secara manual. Saya penasaran apakah ada contoh konkret, pelatihan, atau kustomisasi tertentu yang membuatnya berhasil.
    • Saya mempertanyakan kenapa staf call center harus menghabiskan 3-5 menit untuk menulis ringkasan setiap panggilan. Di banyak use case AI, saya sering melihat otomatisasi terhadap pekerjaan yang sebenarnya tidak perlu. Jika tidak ada yang membaca laporan itu, kualitas ringkasan tidak menjadi masalah, jadi tidak masalah juga kalau AI menulisnya dengan buruk. Dalam efisiensi operasional, yang penting bukan mengotomatisasi proses yang tidak perlu, melainkan menghilangkannya. Pada akhirnya AI sering terasa hanya menutupi pekerjaan organisasi yang boros. Kalau optimasi seperti itu tidak bisa dilakukan, maka mungkin ini tetap diperlukan.
  • Sekarang adalah saat memasuki “Trough of disillusionment”. Siklus hype seperti ini dapat diprediksi. Dengan munculnya penilaian bahwa GPT-5 memberi kekecewaan setelah ekspektasi yang sangat tinggi, ini bisa menjadi titik “sudah selesai” bagi GenAI. Begitu orang mulai bertanya soal ROI, realitas akan terlihat. Orang-orang cerdas sudah menyiapkan transformasi berikutnya, dan masih ada yang akan terus turun sampai dasar lembah itu. PR yang makin putus asa akan terus mendorong narasi "ini benar-benar bernilai".
    • Saya tidak akan heran kalau kebanyakan perusahaan berinvestasi hanya karena harga saham, meski mereka tahu itu pemborosan uang.
    • Gemini memberi kesan cukup baik di setiap pembaruan, tetapi dari sisi kecepatan peningkatan terbaru maupun kualitas isinya, kemajuannya terasa sangat melambat. Ini tampak seperti tanda bahwa tembok mulai mendekat. Dalam pola stagnasi lalu lompatan lagi, saya rasa LLM punya masa depan yang lebih baik daripada computer vision.
    • Sam Altman terlalu mengiklankan kemampuan GPT-5. Dari sudut pandang pengguna, tidak terasa sebagai lompatan besar dibanding GPT-4. Tetapi pendekatan trainable dynamic router yang menurunkan biaya inferensi secara signifikan adalah hal yang sangat berarti. Ini inovasi yang lebih menguntungkan OpenAI dan jaringan listrik daripada pengguna.
    • Saat OpenAI beralih dari GPT-3.5-Turbo ke GPT-4, itu perubahan yang revolusioner dan belum ada model lain. Tetapi sebelum GPT-5 keluar, sudah ada begitu banyak model seperti seri o, Llama, DeepSeek, Gemini, dan lainnya. Ke depan tidak akan ada lagi lompatan seperti dari GPT-3.5 ke 4. GPT-5 memang menyatukan banyak model menjadi satu, tetapi tidak memegang gelar "yang pertama".
    • Saya penasaran apakah ini juga alasan tim Windsurf menjual terlalu cepat lalu pergi.
  • Saya bertanya apa saja use case AI yang realistis yang benar-benar bisa menaikkan pendapatan atau menurunkan biaya. 1. pembuatan konten online (sudah terlalu jenuh) 2. menggantikan developer junior (produktivitasnya terbatas) 3. menggantikan staf layanan pelanggan (ada efek penghematan biaya, tapi sedikit pengaruh ke pendapatan) 4. alat bantu (menulis, analisis, dsb., tetapi ada batasnya) 5. interaksi generasi berikutnya seperti video game/karakter robot 6. pacar virtual AI dan NSFW, pasar ini tampaknya akan tetap menguntungkan untuk sementara. Saya bertanya apakah ada contoh yang lebih realistis.
    • Saya mengerjakan proyek LLM untuk mengekstrak informasi tertentu dari dokumen semi-terstruktur lalu mengklasifikasi/mengarsipkannya secara otomatis. Akurasinya sudah di atas 95% dan saya bahkan belum melakukan fine-tuning. Pada akhirnya tetap ada persetujuan manual, tetapi ini sudah menghemat ratusan jam per tahun. AI sangat efektif untuk ekstraksi informasi dan klasifikasi.
    • Di healthcare, semua catatan seperti clinical note, data, dan interpretasi imaging langsung terhubung dengan pendapatan. Setiap tahun miliaran dolar dihabiskan untuk biaya administrasi di area ini. Jika GenAI bisa sangat meningkatkan kualitas/akurasi note, maka peningkatan pendapatan bisa terjadi secara langsung. Hal yang sama berlaku di asuransi, yang juga membutuhkan dokumentasi dan verifikasi dalam jumlah besar. Pada akhirnya mungkin AI hanya akan saling mengirim dokumen satu sama lain sementara manusia duduk santai di kolam renang.
    • Layanan pelanggan AI adalah pengalaman yang menjengkelkan dari sudut pandang pengguna.
    • Kenaikan produktivitas 50% dengan biaya 200 dolar per bulan adalah nilai yang luar biasa. Di banyak negara, kenaikan produktivitas tahunan hanya 0-2%.
    • Saya berharap ada AI yang mengikat dokumen internal/wiki/codebase perusahaan dengan RAG agar onboarding dan pencarian informasi jadi lebih mudah. Daripada menggantikan manusia, lebih baik mencari cara agar pekerjaan manusia menjadi lebih mudah.
  • Kesalahan terbesar yang dilakukan orang adalah mereka harus memandang AI sebagai fitur, bukan layanan. Tidak ada yang berpikir, "Hari ini saya ingin ngobrol dengan AI!" Pengguna hanya ingin menyelesaikan pekerjaan dengan baik tanpa terlalu bosan atau kewalahan. Di situlah AI seharusnya membantu secara diam-diam. Tetapi yang kita jual bukan fitur melainkan layanan (=produk), jadi dalam marketing AI mau tidak mau ditempatkan di depan. Notion/Slack/Airtable dan semuanya menaruh AI sebagai headline, tetapi inti sebenarnya bukan AI, melainkan hakikat pekerjaan yang dibantu olehnya.
    • Menurut saya AI bahkan bukan sekadar fitur, AI pada akhirnya adalah teknologi. Bukan keinginan "seandainya ada AI di produk ini", melainkan "saya berharap bisa melakukan tugas ini". Kalau produk menyelesaikan pekerjaan saya, metodenya tidak penting. Terlalu banyak perusahaan yang hanya mencoba menyisipkan AI itu sendiri dengan mudah, alih-alih fokus pada penyelesaian masalah yang benar-benar diinginkan pengguna.
    • Itu benar, tetapi secara realistis pendekatan seperti ini akan menghapus valuasi tinggi dan suasana panas di pasar. Ketika momen sadar seperti itu datang, bahkan sektor software "panas" yang tersisa pun akan ikut mendingin, dan industri akan menerima kenyataan bahwa pasar ini bukan lagi seperti 5-10 tahun lalu.
    • Saya berharap AI diperkenalkan hanya sebagai alat lain. Cukup ada satu pop-up yang menjelaskan "ada use case seperti ini". Kenyataannya, berbagai UI dipenuhi logo AI, autocomplete, dan sebagainya, yang justru merusak konsentrasi. Rasanya AI jadi tokoh utama, bukan alat. Padahal seharusnya cukup memberi panduan agar pengguna memakainya sesuai kebutuhan masing-masing, tetapi kesannya terlalu dipaksakan. Perusahaan-perusahaan seperti ini sebaiknya berhenti dan belajar menyerahkan kendali pada pengguna.
    • Sangat setuju, pada akhirnya yang penting adalah nilai produk itu sendiri, bukan apa yang dipakai di bawahnya.
    • Aplikasi-aplikasi AI belakangan ini hampir terasa seperti "solusi yang mencari masalah".
  • Tautan PDF laporan itu diarahkan ulang ke landing page, dan CTA-nya berbunyi "coba sukseskan produk AI lebih cepat", sehingga terasa lebih mirip content marketing biasa daripada laporan objektif. Saya mencoba mengeklik nama penulisnya tetapi tidak muncul apa-apa. Saya tidak percaya baik situs maupun penulisnya. HN sekarang juga mulai seperti Reddit: orang masuk hanya karena judul, lalu meninggalkan komentar setuju/tidak setuju.
  • Saya penasaran apa yang akan terjadi jika orang benar-benar membaca laporannya langsung. https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf Hanya 40% perusahaan yang punya langganan LLM resmi, tetapi lebih dari 90% karyawan perusahaan menggunakan alat AI pribadi secara rutin untuk bekerja. Faktanya, hampir semua karyawan menggunakan LLM dalam satu bentuk atau lainnya. Pengguna "shadow AI" memakai LLM beberapa kali sehari bahkan ketika proyek AI resmi perusahaan masih berhenti di tahap pilot. Jadi ada paradoks: inisiatif AI resmi perusahaan gagal, tetapi di dunia nyata penggunaan LLM justru menyebar di dalam perusahaan. Cerita ini mungkin bukan berita bom baru seperti di artikel, malah bisa sepenuhnya berbeda.
  • Ini seperti contoh bagaimana AS selalu unggul duluan dalam setiap gelombang inovasi teknologi. Mereka menghabiskan dan kehilangan banyak uang, tetapi juga berani mengambil risiko, dan pada akhirnya melaju terlalu jauh untuk dikejar. Terlalu cepat mendeklarasikan kemenangan atas AI/perusahaan AS adalah hal yang berbahaya.
    • Saya rasa sulit menggeneralisasi bahwa AS unggul di semua bidang. Di banyak area seperti keuangan, mereka tertinggal dibanding negara lain. China unggul di EV, tenaga surya, dan sebagainya. Untuk software mungkin benar, tetapi benteng pertahanan AS terbentuk dari monopoli, lock-in, dan regulasi yang disesuaikan untuk kalangan kaya.
    • Cara berpikir seperti itu terlalu sederhana. Justru bisa mendistorsi kenyataan.
    • Dengan menyebut contoh seperti tenaga surya, EV, dan drone, dikatakan bahwa AS tidak bisa selalu dianggap unggul.
    • Sejarah GSM juga disebut sebagai contoh bahwa AS tidak selalu memimpin inovasi.
  • Menarik bahwa penilaian diri terhadap produktivitas bisa berbeda dari kenyataan. Dalam riset METR, developer merasa mereka 20% lebih cepat karena AI, tetapi kenyataannya justru 19% lebih lambat. https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • Ada banyak nuansa yang sulit ditangkap bahkan oleh riset seperti ini. Jenis AI yang dipakai, alat yang digunakan, tingkat familiaritas, proses pengembangan, ukuran tim, dan senioritas maupun ketelitian pengguna, semuanya memengaruhi hasil. Saat ini investor besar-besaran mensubsidi harga AI demi merebut pangsa pasar, tetapi setelah itu berakhir saya justru melihat harga bisa turun lebih jauh. Saya merasa sudah cukup diuntungkan oleh perkembangan AI sejauh ini, dan ke depan fokusnya mungkin akan pada perbaikan bertahap serta peningkatan pengalaman pengguna. Saya tidak berniat berinvestasi di perusahaan AI untuk saat ini.
    • Kadang AI terasa seperti autocomplete yang membaca pikiran saya dengan sempurna, tetapi di waktu lain justru memberi saran yang benar-benar tidak masuk akal dan hanya mengganggu.
    • Saya juga bertanya-tanya apakah AI justru membuat orang terlalu fokus pada perbaikan detail kecil dan kehilangan gambaran besar. Kecepatan pengembangan pada akhirnya lebih banyak ditentukan oleh penilaian strategis secara keseluruhan, seperti apakah saya seharusnya memakai alat ini atau apakah fitur ini benar-benar diperlukan.
    • Meski ukuran sampelnya kecil, ini tetap studi yang jauh lebih berarti daripada data anekdotal atau self-report.