Masa Depan Riset AI: dari Resep ke Meal Kit
(open.substack.com)Ringkasan inti (TL;DR)
-
Ledakan paper AI = kemajuan + sekaligus ‘Noise Tax’
- 2013 → 2023 paper AI tahunan: ~102.000 → ~242.000
- Pada periode yang sama, porsi AI di antara paper CS: 21,6% → 41,8%
-
Semakin banyak paper, biaya seleksi/reproduksi/operasional ikut meledak
- Yang dibaca makin banyak, tapi produk makin kurang stabil
- Semakin mengejar SOTA, reproduksibilitas dan operasionalitas justru menurun
-
Saat paper dibawa ke production, 4 mode kegagalan hampir selalu muncul
-
Karena itu sinyal 2026 sederhana:
DIY (implementasi resep) ↓ / Packaging (meal kit) ↑- Dibanding “baca paper lalu implementasi”, unit yang siap langsung dideploy akan menang
- Packaging seperti NVIDIA NIM / SLM / Ollama membentuk arus standardisasi
Definisi masalah: paper AI adalah ‘resep Michelin’
Penulis mengibaratkan paper riset AI sebagai resep dari chef Michelin.
Masalahnya bukan pada resepnya. Yang berbeda adalah dapur kita.
Paper disusun di dapur yang sempurna.
- klaster H100
- dataset yang bersih dan telah dikurasi
- trik-trik tersembunyi yang dioptimalkan untuk lingkungan eksperimen
Lalu ketika resep itu turun ke lapangan (on-prem, legacy, compliance, operasi), pola yang sama terus berulang.
Dari paper ke production: 4 mode kegagalan
1) Broken Utensils (infrastruktur)
-
Hasil paper dibuat dengan asumsi ribuan H100
-
Realitasnya adalah GPU kecil / VRAM terbatas / jaringan terbatas
-
Masalahnya bukan “performanya turun sedikit”
→ fenomenanya sendiri tidak muncul -
Gejala yang umum:
- “jalan sih jalan, tapi perilaku yang diharapkan tidak ada”
- pipeline selesai, tetapi promised behavior tidak muncul
2) Spoiled Ingredients (data)
-
Paper mengasumsikan data yang telah dikurasi
-
Data di lapangan adalah:
- log, PDF hasil scan, dokumen legacy, perubahan skema, sumber yang tidak jelas
-
RAG/inference akan langsung menuju halusinasi jika struktur, dasar bukti, dan konsistensi rusak
-
Yang lebih berbahaya:
- hasilnya fasih, jadi lebih mudah dipercaya
- “terlihat normal tapi salah” adalah yang paling mahal
3) Missing Salt (detail engineering)
-
Bagian “Season to taste” justru yang paling besar
-
Penentunya di dunia nyata:
- inisialisasi / scheduler / tuning sampai 0,001 / prompt template
-
Hal-hal seperti ini tidak muat dalam 8 halaman paper
-
Pada praktiknya, pembeda akhirnya ada di sini:
- bukan resepnya, tetapi bumbu rahasia (kondisi reproduksi) yang menentukan hasil
4) Responsibility Gap (tanggung jawab)
-
Saat gagal, kesimpulannya jadi seperti ini:
- “matematikanya benar. masalahnya ada di environment kamu”
-
Tanggung jawab atas gap itu turun ke downstream
→ pada akhirnya orang yang membaca paper dan merekomendasikannya yang kena imbasnya. -
Saat terjadi insiden/audit, itu menjadi “sistem yang kita bangun”
2 batasan struktural: penyebab orang meninggalkan DIY
A) Paper Explosion = Noise Tax
Semakin banyak paper, biaya seleksi meledak.
- Yang dibaca makin banyak, tapi produk makin kurang stabil
- Semakin mengejar SOTA, operasionalitas menurun
- Ini bukan “kelimpahan pengetahuan”, tetapi “biaya memilih”
B) Perubahan arah kapital: ‘paper’ → ‘operasi’
Uang bergerak dari “resep baru” ke paket yang bisa dioperasikan.
Pertanyaan investasi sudah berubah.
- ini demo, atau operasi sungguhan?
- apakah biaya/latensi/observabilitas/audit bisa ditangani?
Risiko operasional biasanya bermuara pada 3 hal ini:
- risiko biaya: PoC berhasil, tetapi meledak saat operasi
- risiko kepercayaan: jika dasar bukti/sumber rusak, jawaban yang terdengar meyakinkan tetap berbahaya
- risiko tanggung jawab: jika ada insiden atau audit, tanggung jawab jatuh ke kita
Sinyal terkuat 2026: Packaging
AI Meal Kit = Ready-to-deploy + unit deployment dengan batas tanggung jawab yang jelas saat terjadi kegagalan
Jadi, kesimpulan untuk 2026 adalah ini:
Packaging beats ingenuity.
4 sinyal pasar
Signal #1) NVIDIA NIMs
- konfigurasi model/dependensi/optimisasi dikunci dalam container
- tebakan dalam toolchain berkurang
- bumbu rahasianya sudah ada di dalam
- pesannya: “Tune less. Run more.”
Signal #2) SLMs
- semakin banyak “resep yang disesuaikan dengan dapur”
- peluang operasi lokal/edge meningkat
- arahnya: bounded / predictable / cheaper to operate
Signal #3) AI in a Box
- server dijual bukan lagi sebagai “komponen”, tetapi sebagai “produk jadi”
- termasuk RAG/keamanan/konfigurasi dasar
- dampaknya: muncul batas yang jelas tentang siapa yang bertanggung jawab atas gap tersebut
Signal #4) Ollama / LM Studio
- tingkat kesulitan konfigurasi environment turun drastis
- jumlah operator bertambah
- ketika operator bertambah, pasar selalu bergerak begini: standardisasi makin cepat
Sudut pandang praktis: metrik yang perlu langsung dilihat
- Compute Fit: apakah performa target bisa direproduksi di “GPU/VRAM kita”?
- Data Fit: apakah data input mempertahankan “struktur/dasar bukti/sumber”?
- Hidden Salt: apakah script/prompt/nilai tuning yang dibutuhkan untuk reproduksi sudah dikunci versinya?
- Owner: saat gagal, permukaan tanggung jawab ada di mana? (kita? vendor? package?)
- Ops: apakah observabilitas (log/metrik), rollback, batas biaya, dan audit sudah masuk ke desain?
Kesimpulan
Pada 2026, yang menang bukan “model yang lebih pintar”, melainkan
“unit deployment yang lebih jarang meledak”.
Paper akan terus terbit, tetapi pasar membeli inteligensi yang sudah dikemas.
Tim juga harus memilih.
- apakah akan terus mengimplementasikan resep
- atau mengemas dan mengoperasikannya pada level meal kit
One-liner
“Paper menjual ide, pasar membeli operasi.”
2 komentar
Tapi, apakah awalnya memang pernah ada kasus di bisnis yang membaca paper lalu mengimplementasikannya sendiri untuk dipakai..?
Memang ada. Namun, kebanyakan tampaknya bukan membuat dari nol setelah membaca paper, melainkan sering menelusuri implementasi referensi open source.
Belakangan ini, kalau muncul paper yang sedang hangat di ranah AI, POC juga bermunculan deras, tetapi saat masuk ke production, sering kali karena data/infrastruktur/tuning hasilnya “memang jalan, tapi rasanya tidak seperti yang diharapkan”.
Karena itu, belakangan ini terasa ada kecenderungan berkumpul ke stack yang sudah dipaketkan seperti vLLM dan Ollama.