- Modal besar dan talenta kelas dunia mengalir ke bidang robotika, tetapi deploy di lapangan nyata di luar lingkungan terbatas seperti otomasi industri masih sangat minim
- Perubahan struktural sedang berlangsung secara bersamaan, seperti turunnya biaya komponen, membaiknya keekonomian baterai, kemajuan arsitektur model, dan peningkatan lingkungan simulasi
- Dibandingkan sekitar 1 miliar jam video internet, data manipulasi robot hanya sekitar 300 ribu jam di seluruh dunia, sehingga secara fundamental berada dalam kondisi keterbatasan data
- Biaya aktuator, baterai, komputasi, dan sistem menurun sementara biaya tenaga kerja meningkat, sehingga tercapai titik persilangan ekonomi di mana nilai marjinal otomasi meningkat
- Tiga area bottleneck untuk akumulasi nilai ke depan adalah perolehan data, laboratorium AI robot, dan penyedia solusi vertikal
Situasi saat ini: titik temu antara hype dan perubahan struktural
- Meski modal besar mengalir ke robotika dan demo impresif terus bermunculan, penerapan nyata di gudang, pertanian, pabrik, rumah sakit, dan lokasi konstruksi masih belum jauh berbeda dari lingkungan kerja tradisional
- Hype tersebut ditopang oleh perubahan struktural seperti turunnya biaya komponen, membaiknya keekonomian baterai, arsitektur model yang lebih kuat, simulasi dan lingkungan pelatihan yang lebih baik, serta flywheel talenta yang dibentuk oleh arus modal dan ambisi yang berdekatan dengan AGI
- Pertanyaan utamanya bukan apakah robotika punya potensi, melainkan apakah kini berada di titik belok adopsi komersial dan konsumen, serta bagaimana memverifikasi momentum saat ini
Empat era dalam sejarah robot
I. 1950–2000: masuk ke industri dan pembangunan fondasi
- Era yang ditentukan oleh mekatronika yang dapat diprogram, dimulai dari robot industri pertama Unimate yang diperkenalkan General Motors pada 1961 untuk gerakan mekanis terbatas
- Stanford Arm memperluas kemampuan multi-sumbu dan tetap menjadi fokus utama riset hingga 1990-an
- Munculnya PLC dari Modicon pada 1968 dan mikroprosesor Intel 4004 pada 1971 membuat kecerdasan mesin dapat diperluas secara ekonomis ke seluruh otomasi industri
- Saat IBM PC pada 1980-an membawa komputasi ke arus utama rekayasa, robot tidak lagi menjadi instalasi mesin yang terisolasi, melainkan terintegrasi sebagai bagian dari lingkungan produksi digital
II. 2000–2010: era open robotics dan komponen mobile
- Commit pertama ROS (Robot Operating System) pada 2007 dan platform riset PR2 untuk pertama kalinya memberi komunitas lapisan perangkat lunak bersama serta lingkungan pengembangan umum
- Pada tahun yang sama, peluncuran iPhone oleh Apple memulai kompresi biaya jangka panjang di seluruh rantai pasok sensor, baterai, kamera, embedded compute, dan komponen elektronik hemat daya, yang kemudian diwarisi robotika
- Universal Robots (didirikan pada 2005), Roomba dari iRobot (2002), dan Kiva Systems (2003) menjadi penerima manfaat langsung
- Akuisisi Kiva oleh Amazon pada 2012 menjadi sinyal nyata pertama bahwa robotika dapat menciptakan nilai komersial strategis, melampaui sekadar antusiasme riset
III. 2010–2020: robot kolaboratif dan edge compute
- Tiga hal bertemu: (1) robot kolaboratif meraih keandalan komersial — KUKA LBR iiwa menjadi robot sensitif produksi massal pertama yang tersertifikasi untuk kolaborasi manusia-robot, sementara Universal Robots terus mendorong aksesibilitas dan kemudahan deployment
- (2) Peluncuran Nvidia Jetson pada 2014 membuat GPU edge compute menjadi praktis, sehingga AI real-time dan computer vision mendekati sistem yang siap dideploy, dibangun di atas CUDA 2006 dan kemudian arsitektur transformer
- (3) Pergeseran mendasar pada stack AI — terobosan seperti Trust Region Policy Optimization, Model-Agnostic Meta-Learning, dan Non-Local Neural Networks mulai menggantikan pipeline buatan tangan dengan persepsi dan kontrol end-to-end berbasis data
- Hasilnya, robot beralih dari aturan hard-coded yang terstruktur ke pembelajaran berbasis persepsi melalui reinforcement learning, simulasi, dan imitasi, sehingga keterampilan motorik dipelajari dari data, bukan pemrograman eksplisit
IV. 2020–sekarang: Physical AI
- Makalah transformer Google pada 2017 berujung pada RT-1 (2022), yang membingkai kontrol robot sebagai persoalan transformer yang dilatih dengan dataset dunia nyata yang besar dan beragam
- RT-2 (2023) meluas menjadi model vision-language-action (VLA) yang belajar dari data web dan data robot sekaligus
- NVIDIA mengumumkan Project GR00T (2024), lalu merilis model fondasi robot humanoid terbuka GR00T N1 (2025)
- Muncul laboratorium model robot baru seperti Physical Intelligence, Skild AI, dan Field AI
- Koneksi nirkabel yang lebih cepat lewat 5G, teleoperasi yang lebih andal, pipeline data yang lebih baik, dan peningkatan kemampuan hardware di lapangan memperluas operasi jarak jauh, fleet software, dan loop pengumpulan data
Perubahan kondisi ekonomi
Turunnya biaya komponen dan sistem
- Komponen utama sistem robot meliputi aktuator, sensor, baterai, semikonduktor/chip, dan struktur mekanis; robot humanoid menjadi proksi yang masuk akal karena mencakup sebagian besar dari komponen tersebut
- Morgan Stanley mengurai BOM Tesla Optimus per bagian untuk mencontohkan kontribusi masing-masing komponen dalam keseluruhan sistem
Aktuator
- Dalam banyak sistem robot, ini merupakan porsi biaya terbesar, dan dominasi pasar oleh Tiongkok menambah kompleksitas untuk use case tertentu serta ketahanan rantai pasok
- Harga rata-rata aktuator cenderung naik melampaui inflasi, tetapi jika dinormalisasi berdasarkan densitas, prospek riil membaik secara berarti
- Presisi, kontrol, dan gerakan presisi aktuator linear elektrik terus meningkat — error pelacakan motor linear magnet permanen turun dari kurang dari 7μm pada 2003 menjadi sekitar 0.5μm RMS dalam riset berikutnya
Biaya baterai
- Turun tajam didorong oleh industri otomotif dan penyimpanan energi skala grid
- Untuk Li-Ion, biaya per kWh turun sekitar 87% sejak 2013, dan sekitar 36% lagi sejak 2020, meski diperkirakan mendekati fase stabilisasi
Biaya komputasi
- Bukan item BOM langsung, tetapi sangat penting bagi keekonomian jangka panjang
- Agar robot bisa melampaui tenaga kerja manusia, dibutuhkan penurunan biaya edge compute yang berkelanjutan dan peningkatan kinerja model terparametrisasi
- Berdasarkan chip seri Nvidia Jetson, performa per dolar telah meningkat berlipat digit sejak 2014
Biaya sistem
- Mengambil contoh robot industri, biayanya telah turun signifikan dalam 30 tahun terakhir dan diperkirakan terus menurun
Biaya tenaga kerja di AS
- Upah rata-rata per jam di pergudangan dan logistik, salah satu use case utama, terus meningkat
- Pertumbuhan upah pekerja transportasi dan pergudangan melampaui inflasi dari indeks dasar 2003, menegaskan pentingnya permintaan tenaga kerja di sektor ini
Meningkatnya nilai ekonomi otomasi
- Jika kurva biaya ini digabungkan, maka nilai marjinal otomasi/robotika sedang meningkat
- Hal ini terlihat jelas bila divisualisasikan dengan basis NPV, walau "efficient frontier" dapat berbeda tergantung model
- Asumsi: upah dan tunjangan pekerja gudang level awal menurut Indeed, masa pakai 8 tahun, biaya perawatan 20% dalam model pembayaran di muka, dan discount rate 10%
Trade-off utama di titik belok adopsi
- Hardware vs. intelligence — mencerminkan perbedaan pendekatan Tiongkok dan AS. Tiongkok unggul dalam pengembangan hardware berkat infrastruktur manufaktur dan rantai pasok yang sudah ada, sementara AS memimpin lebih awal di AI/ML dan laboratorium model fondasi LLM. Seiring waktu, area irisan keduanya diperkirakan meluas
- Industri vs. konsumen — pallet picking dan memungut piring tampak serupa di permukaan, tetapi berbeda dalam dinamika gerak, mekanika genggaman, dan toleransi tekanan. Karena robot sudah lebih hadir di lingkungan industri dan ROI-nya lebih jelas, sektor industri akan lebih dulu berkembang, baru kemudian humanoid rumah tangga
- Open source (Android) vs. closed (iOS) — seperti pemisahan Android/iOS di smartphone, robotika juga mulai terbelah antara platform terbuka berpusat pada pengembang (padanan ROS, ekosistem hardware terbuka) dan sistem tertutup terintegrasi vertikal yang menyatukan hardware, software, dan model secara erat
Stack intelligence: melampaui ekonomi
- Turunnya biaya komponen meningkatkan kelayakan pembiayaan robot, tetapi tidak menjelaskan mengapa narasi pasar bergeser dari otomasi sempit ke robot umum — pergeseran itu berkaitan dengan lapisan intelligence
- Robot sedang bergerak dari persepsi, perencanaan, dan asumsi dunia berbasis rekayasa yang lebih sederhana menuju representasi terpelajar yang dilatih dengan video skala besar, demonstrasi robot, prediksi sintetis, dan input multimodal
1. Masalah data
- Robotika masih belum memiliki data padanan internet untuk dunia fisik
- LLM memanen teks dan media yang telah terdigitalisasi, sedangkan pembelajaran robot masih bergantung pada teleoperasi, operator manusia, hardware fisik, dan lingkungan dunia nyata
- Kesenjangan data: sekitar 1 miliar jam video internet → sekitar 350 juta jam data autonomous driving → sekitar 20 juta jam proksi pelatihan world model (seperti Cosmos) → sekitar 300 ribu jam data manipulasi robot di seluruh dunia (menurut laporan Bessemer)
- Tidak semua data dihasilkan atau dapat digunakan dengan cara yang sama, dan secara umum nilai data berbanding terbalik dengan skalabilitasnya
2. Peningkatan performa lapisan intelligence
- Baik pengetahuan dunia (world model) maupun pengetahuan tindakan (model VLM/VLA, model fondasi robot multimodal) berkembang cepat
- Pengetahuan dunia — seperti gerak objek, aliran cairan, atau jatuhnya kain — semakin dapat dipelajari dari video yang kaya dan pemodelan
- Pengetahuan tindakan — bagaimana lengan, tangan, atau humanoid tertentu menerjemahkan perintah menjadi gerakan — masih sangat spesifik terhadap embodiment, tetapi mungkin memerlukan data robot-spesifik yang jauh lebih sedikit daripada asumsi generasi sebelumnya
- V-JEPA 2 dari Meta dipra-latih dengan lebih dari 1 juta jam video, lalu mengondisikan tindakan dengan kurang dari 62 jam video robot
- RT-2 dari Google memperluas pembelajaran vision-language skala web ke kontrol robot dunia nyata
- Simulator tetap relevan dan locomotion cocok dengan physics engine, tetapi perannya makin menyempit. Dalam manipulasi yang kaya kontak, world model yang dipelajari menjadi lebih penting
3. Dari teori ke solusi
- Model yang lebih baik pertama-tama tampak sebagai hasil praktis: grasping yang lebih baik, intervensi teleoperasi yang lebih sedikit, adaptasi lebih cepat terhadap SKU baru, manipulasi yang lebih tangguh, dan waktu operasi otonom yang lebih lama dalam workflow terbatas
- Perdebatan soal "momen ChatGPT" bagi robot terus berlangsung, tetapi pertanyaan yang lebih relevan adalah apakah lapisan intelligence baru ini cukup untuk melampaui ambang transisi dari pilot ke produksi
- Urutan penyelesaian stack: perolehan data → laboratorium neo robot mengubahnya menjadi intelligence yang dapat digunakan ulang → penyedia solusi vertikal mengubahnya menjadi keekonomian tenaga kerja yang terukur
Area minat investasi: tiga bottleneck utama
1. Kurangnya ketersediaan data → Data Enablement
- Jika robotika pada dasarnya berada dalam kondisi kekurangan data, maka perolehan data adalah salah satu kategori jangka pendek terpenting dalam stack
- Mencakup penangkapan data egosentris dan teleoperasi, pembuatan lingkungan sintetis, evaluasi edge case, pemurnian sinyal, dan pembuatan feedback loop untuk meningkatkan sistem
- Referensi yang relevan: Scale AI (pelabelan dan anotasi data), Mercor / Mirco1 (data manusia)
- Mirip dengan gelombang awal pelabelan data AI, bisnis terkuat kemungkinan bergerak dari wedge layanan/alat awal menuju software workflow bernilai tinggi, alat yang berdekatan dengan model, dan loop data proprietari yang sulit digantikan
- Kali ini, hardware juga bisa menjadi bagian dari itu
2. Lapisan intelligence masih dini → Robotic Neo Labs
- Karena lapisan intelligence makin berguna tetapi masih dini, Robotic Neo Labs menjadi area logis berikutnya
- Ini adalah perusahaan-perusahaan yang berupaya mengubah world model fisik yang dulu terfragmentasi menjadi intelligence yang dapat digunakan ulang
- Nilai akan terakumulasi pada tim yang membangun seputar world model, action model, model fondasi robot multimodal, serta alat pelatihan, evaluasi, dan deployment
- Skild, Physical Intelligence, dan Field AI sudah mencapai valuasi miliaran dolar, menandai dimulainya siklus kingmaker laboratorium robot
- Minat yang lebih besar bukan pada laboratoriumnya sendiri, melainkan pada apa yang dibangun di sekitar dan di bawah laboratorium tersebut — tim yang dapat menciptakan efek compounding di data, embodiment, evaluasi, dan efisiensi inferensi akan menjadi pemenang sejati
- Jalur exit juga diperkirakan berbeda dari siklus robot sebelumnya — dibanding milestone tradisional, kecepatan, kepadatan talenta, data proprietari, dan positioning teknis mungkin akan lebih penting
- Diperkirakan akan ada lebih banyak acquihire, hasil berbasis IP, dan kemitraan strategis
- Minat pada edge inference dan on-device compute yang terspesialisasi kemungkinan muncul kembali, karena laboratorium dan mitranya berupaya mengurangi ketergantungan pada komputasi terpusat yang mahal
3. Mengubah kemajuan teknologi menjadi hasil workflow nyata → Vertical Solution Providers (VSP)
- Jika intelligence yang lebih baik membuat robot lebih cakap di lingkungan terbatas, maka penerima manfaat komersial paling langsung adalah perusahaan yang mendeploy teknologi itu ke workflow pelanggan nyata
- Banyak workflow fisik cukup terbatasi untuk dapat dipelajari, cukup bernilai untuk membenarkan deployment, dan cukup kompleks sehingga intelligence yang lebih baik menjadi bagian yang selama ini hilang
- Use case industri dan komersial lebih menjanjikan dalam jangka pendek dibanding konsumen — ROI lebih jelas, masalah tenaga kerja lebih mendesak, dan jalur dari pilot ke produksi lebih mudah diakuisisi
- Tantangan utamanya adalah belum adanya standar adopsi universal — pelanggan mengevaluasi dalam skala geser antara kecepatan (item yang dikemas per jam), akurasi (persentase item yang dipilih dengan benar), dan biaya (biaya rata-rata per jam), dengan efisiensi tenaga kerja sebagai metrik akhir
- Ekspansi kemungkinan dimulai sebagai augmentasi tenaga kerja — ROI terutama ditemukan pada segmen kekurangan tenaga kerja dan jam-jam dengan ketersediaan pekerja rendah seperti malam dan akhir pekan, ketika ambang kecepatan dan akurasi yang lebih rendah dapat membenarkan biaya awal yang tinggi sambil membangun skala domestik
- Lapisan akumulasi berikutnya sudah terlihat: integrasi, servicing, manajemen uptime, maintenance, dan financing
- Formic telah menyoroti realitas ini sejak dini; saat robot beralih dari pilot ke armada, ekosistem di sekitarnya juga menjadi layak untuk diinvestasikan
- Di banyak pasar, justru di area inilah perusahaan yang berkelanjutan pada akhirnya dibangun
Belum ada komentar.