- Sektor robotika menarik investasi tertinggi sepanjang sejarah sebesar $40,7 miliar pada 2025, naik 74% dibanding tahun sebelumnya dan mencakup 9% dari total pendanaan ventura, sehingga muncul sebagai salah satu bidang investasi terdepan bersama perangkat lunak AI
- Physical AI/AI fisik adalah teknologi inti yang memungkinkan robot belajar dari data, bukan dari aturan yang telah diprogram sebelumnya, agar dapat beroperasi di dunia fisik
- Berbeda dengan model bahasa, model Physical AI memerlukan data robot dunia nyata, sehingga menciptakan peluang penguasaan pasar bagi pemain yang bergerak lebih awal
- Di 10 kategori model Physical AI, lebih dari 70 perusahaan sedang bersaing dalam area data & simulasi, pendekatan model, foundation model, dan observability
- Kolaborasi multi-robot tetap menjadi tantangan utama yang belum terselesaikan dalam Physical AI, dan perusahaan yang lebih dulu memecahkannya diperkirakan akan memimpin ekspansi industri armada robot otonom
Poin utama
- Data pelatihan proprietari adalah keunggulan kompetitif utama dalam Physical AI, dan perusahaan teknologi besar kini berupaya mengamankan akses data melalui akuisisi
- Nvidia mengakuisisi penyedia data sintetis Gretel pada Maret 2025 dengan nilai lebih dari $320 juta
- Meta menanamkan investasi ekuitas senilai $14,8 miliar di Scale, perusahaan infrastruktur data dan pengembangan model
- OpenAI sempat mencoba mengakuisisi Medal untuk mengamankan data pelatihan, tetapi Medal malah meluncurkan General Intuition, yang membangun model menggunakan data tersebut
- Perusahaan yang mengamankan data pelatihan proprietari dapat mengembangkan model yang lebih unggul, sementara pesaing harus bergantung pada akses lisensi
- Mengamankan data pelatihan yang beragam dan berkualitas tinggi sejak dini adalah kunci untuk mencapai skala komersial
- World model memungkinkan robot memprediksi dan merencanakan secara otonom, kemampuan yang belum dapat dicapai oleh large language model (LLM)
- Investasi pada world model melonjak dari $1,4 miliar pada 2024 menjadi $6,9 miliar pada 2025
- Perusahaan di bidang ini memiliki skor Mosaic rata-rata 722 (3% teratas dari seluruh pasar)
- Keberhasilan memerlukan data pelatihan berkualitas tinggi dari lingkungan terkontrol serta kemitraan erat dengan produsen perangkat keras
- Kolaborasi multi-robot masih menjadi persoalan inti yang belum terselesaikan dalam Physical AI
- Perusahaan AS menarik investasi lebih dari $17 miliar melalui 17 transaksi
- Perusahaan Tiongkok menarik investasi $416 juta melalui 15 transaksi
- Di kedua wilayah, fokus hampir sepenuhnya tertuju pada kemampuan robot tunggal, dan hanya sedikit perusahaan yang membangun lapisan orkestrasi yang dibutuhkan agar beragam jenis robot dapat bekerja bersama
- Perusahaan yang lebih dulu memecahkan persoalan kolaborasi berpotensi mengendalikan ekspansi industri armada robot otonom
Gambaran kategori
-
Data & simulasi
- Menyediakan fondasi bagi pembelajaran robot; robot membutuhkan data pelatihan dalam jumlah besar, tetapi pengumpulan data nyata lambat dan mahal
- Terdiri dari tiga subpasar:
- Data pelatihan sintetis — robotika: alat untuk membuat dataset sintetis seperti gambar, data sensor, dan adegan 3D tanpa pengumpulan dunia nyata yang mahal
- Penyedia data demonstrasi robot: perusahaan yang menangkap data nyata seperti data teleoperasi, lintasan gerak, dan video untuk imitation learning
- Platform simulasi robotika: lingkungan virtual untuk melatih, menguji, dan memvalidasi robot sebelum diterapkan secara fisik
- Kelangkaan data menjadi hambatan utama Physical AI, karena masalah biaya dan ketersediaan membuat akses ke data pelatihan nyata menjadi sulit
- Pasar-pasar ini memiliki skor Mosaic rata-rata sekitar 600 (masuk separuh teratas dari sisi momentum pasar)
- 50% perusahaan telah memasuki tahap deployment, menunjukkan bahwa infrastruktur data untuk Physical AI telah matang dari riset menuju kelayakan komersial
- Banyak perusahaan bergantung pada data sintetis dan simulasi, dengan Nvidia memimpin pasar
- Namun, data sintetis saja tidak cukup; data robot nyata tetap penting untuk melatih model yang andal
- Scale menerima investasi sebesar $16,4 miliar dan berada di 1% teratas dalam skor Mosaic
- Scale memperluas bisnis pelabelan datanya ke pengembangan model dengan menggabungkan pembuatan data sintetis dan pengumpulan data nyata, termasuk teleoperasi manusia terhadap robot serta data sensor dari lingkungan fisik
- Perusahaan-perusahaan baru mencari sumber data baru untuk mengatasi kekurangan data yang ada
- General Intuition mengumpulkan investasi $134 juta untuk melatih model menggunakan video gameplay yang dapat diterapkan pada sistem robotika
- micro1 menerima investasi $35 juta dengan valuasi $500 juta untuk membangun dataset pelatihan robotika terbesar di dunia dari video interaksi manusia
- Tanpa dataset proprietari atau platform simulasi, perusahaan robotika berisiko harus melisensikan dari pemimpin pasar atau tertinggal dalam jenis data penting seperti sentuhan, tekanan, dan gerakan fisik
-
Pendekatan terhadap model
- Memberikan kemampuan penglihatan, penalaran, dan tindakan kepada robot, dengan tiap model dibangun di atas model lain
- Memungkinkan robot beradaptasi dengan tugas baru alih-alih bergantung pada pemrograman yang kaku
- Terdiri dari tiga subpasar:
- Pengembang vision-language model (VLM): model multimodal yang menggabungkan pemahaman visual dan bahasa alami, berfungsi sebagai lapisan persepsi robot
- Pengembang vision-language-action (VLA) model: sistem AI yang dibangun di atas VLM dan menggabungkan persepsi visual, pemahaman bahasa, serta kontrol motorik untuk langsung menerjemahkan perintah menjadi tindakan fisik
- Pengembang world model AI: model yang mensimulasikan perubahan lingkungan untuk memprediksi relasi spasial, hukum fisika, dan hubungan sebab-akibat
- Physical AI menggeser robotika dari pemrograman yang di-hardcode menjadi sistem yang fleksibel dan adaptif terhadap tugas, dengan model VLA muncul sebagai arsitektur terdepan
- Perusahaan robot humanoid terkemuka seperti Figure, 1X, dan Galbot sedang membangun model VLA proprietari
- Perusahaan big tech seperti Nvidia dan Meta sedang mengembangkan model untuk lisensi komersial kepada produsen robot
- World model berpotensi menjadi terobosan sejati dengan menambahkan penalaran prediktif
- Perusahaan seperti World Labs dan Runway sedang membangun world model
- Berbeda dari VLA yang bereaksi terhadap input langsung, world model mensimulasikan perubahan lingkungan seiring waktu
- Ini memungkinkan robot memprediksi hasil, merencanakan tindakan multilangkah, dan pulih dari kesalahan
-
Foundation model
- Menggabungkan data dan arsitektur untuk menghadirkan kecerdasan robot pralatih yang mampu melakukan persepsi, penalaran, dan tindakan
- Sebagiannya adalah model serbaguna untuk manipulasi, sementara lainnya lebih terspesialisasi
- Pengembang dapat melisensikan dan menerapkan kecerdasan ini tanpa harus membangunnya dari nol
- Terdiri dari tiga subpasar:
- Pengembang robot foundation model: model serbaguna yang membantu robot melihat, berpikir, dan bergerak di berbagai perangkat keras
- Pengembang foundation model untuk autonomous driving: dilatih dengan dataset berkendara skala besar untuk mengintegrasikan persepsi, prediksi, perencanaan, dan kontrol, serta menggantikan sistem otonom lama untuk robotaxi, truk, dan pengiriman
- Pengembang model kolaborasi multi-robot: algoritme multi-agen yang memungkinkan kawanan robot bekerja sama dengan menangani pembagian tugas, penghindaran tabrakan, dan pengambilan keputusan terdistribusi
- Pasar foundation model sangat dinamis
- Raksasa teknologi AS (Microsoft, Google, Amazon) dan pemain terdepan Tiongkok (Huawei, Baidu) bersaing dengan startup yang banyak diperhatikan seperti DeepSeek dan Physical Intelligence
- Banyak perusahaan bekerja di beberapa jenis foundation model sekaligus
- Data pelatihan dari satu domain dapat membantu meningkatkan performa model di domain lain
- Nvidia adalah satu-satunya perusahaan yang aktif di ketiga kategori foundation model, memosisikan diri sebagai infrastruktur bagi seluruh stack Physical AI
- Kolaborasi multi-robot adalah frontier berikutnya
- Misalnya skenario di gudang tempat humanoid, autonomous mobile robot, dan forklift otonom bekerja bersama
- Kolaborasi antarberbagai jenis robot membutuhkan lapisan orkestrasi yang mengelola tugas, sumber daya, dan penghindaran tabrakan tanpa kontrol terpusat
- Hanya segelintir startup seperti Field AI dan Intrinsic, serta beberapa perusahaan big tech, yang mengejarnya
- Sebagian besar pekerjaan masih berada pada tahap riset, bukan deployment komersial
- Perusahaan dengan model proprietari dapat memperoleh margin lebih tinggi melalui diferensiasi dan integrasi vertikal
- Perusahaan yang melisensikan AI pihak ketiga bisa mendapat manfaat dari biaya yang lebih rendah akibat komoditisasi model, tetapi mereka bersaing lewat kecepatan deployment dan kualitas integrasi, bukan teknologi inti
-
Observability
- Menangkap apa yang terjadi saat robot beroperasi di produksi, menjembatani kesenjangan antara pengembangan di laboratorium dan deployment di dunia nyata
- Platform observability robotika: platform untuk memantau, men-debug, dan mengoptimalkan robot dalam pengembangan maupun produksi
- Saat robot gagal atau berperilaku tak terduga, engineer dapat memutar ulang insiden, menemukan penyebabnya, lalu mendorong perbaikan
- Edge case nyata dapat dimasukkan kembali ke simulasi dan pelatihan untuk memperbaiki model dan meningkatkan performa
- Foxglove dan Formant adalah contoh representatif yang melacak performa, menganalisis kegagalan, dan mengalirkan kembali insight deployment ke dataset pelatihan, simulasi, dan model
- Perusahaan dengan observability yang kuat dapat belajar dari kegagalan dan memperbaiki model dengan cepat
- Situasi tak terduga berubah menjadi keunggulan pembelajaran, menjadi faktor kunci yang membedakan sistem siap produksi dari prototipe laboratorium
Belum ada komentar.