Peta pasar model Physical AI: sisi persaingan di balik kecerdasan robot

Sektor robotika menarik investasi tertinggi sepanjang sejarah sebesar $40,7 miliar pada 2025, naik 74% dibanding tahun sebelumnya dan mencakup 9% dari total pendanaan ventura, sehingga muncul sebagai salah satu bidang investasi terdepan bersama perangkat lunak AI
Physical AI/AI fisik adalah teknologi inti yang memungkinkan robot belajar dari data, bukan dari aturan yang telah diprogram sebelumnya, agar dapat beroperasi di dunia fisik
Berbeda dengan model bahasa, model Physical AI memerlukan data robot dunia nyata, sehingga menciptakan peluang penguasaan pasar bagi pemain yang bergerak lebih awal
Di 10 kategori model Physical AI, lebih dari 70 perusahaan sedang bersaing dalam area data & simulasi, pendekatan model, foundation model, dan observability
Kolaborasi multi-robot tetap menjadi tantangan utama yang belum terselesaikan dalam Physical AI, dan perusahaan yang lebih dulu memecahkannya diperkirakan akan memimpin ekspansi industri armada robot otonom

Poin utama

Data pelatihan proprietari adalah keunggulan kompetitif utama dalam Physical AI, dan perusahaan teknologi besar kini berupaya mengamankan akses data melalui akuisisi
- Nvidia mengakuisisi penyedia data sintetis Gretel pada Maret 2025 dengan nilai lebih dari $320 juta
- Meta menanamkan investasi ekuitas senilai $14,8 miliar di Scale, perusahaan infrastruktur data dan pengembangan model
- OpenAI sempat mencoba mengakuisisi Medal untuk mengamankan data pelatihan, tetapi Medal malah meluncurkan General Intuition, yang membangun model menggunakan data tersebut
- Perusahaan yang mengamankan data pelatihan proprietari dapat mengembangkan model yang lebih unggul, sementara pesaing harus bergantung pada akses lisensi
- Mengamankan data pelatihan yang beragam dan berkualitas tinggi sejak dini adalah kunci untuk mencapai skala komersial
World model memungkinkan robot memprediksi dan merencanakan secara otonom, kemampuan yang belum dapat dicapai oleh large language model (LLM)
- Investasi pada world model melonjak dari $1,4 miliar pada 2024 menjadi $6,9 miliar pada 2025
- Perusahaan di bidang ini memiliki skor Mosaic rata-rata 722 (3% teratas dari seluruh pasar)
- Keberhasilan memerlukan data pelatihan berkualitas tinggi dari lingkungan terkontrol serta kemitraan erat dengan produsen perangkat keras
Kolaborasi multi-robot masih menjadi persoalan inti yang belum terselesaikan dalam Physical AI
- Perusahaan AS menarik investasi lebih dari $17 miliar melalui 17 transaksi
- Perusahaan Tiongkok menarik investasi $416 juta melalui 15 transaksi
- Di kedua wilayah, fokus hampir sepenuhnya tertuju pada kemampuan robot tunggal, dan hanya sedikit perusahaan yang membangun lapisan orkestrasi yang dibutuhkan agar beragam jenis robot dapat bekerja bersama
- Perusahaan yang lebih dulu memecahkan persoalan kolaborasi berpotensi mengendalikan ekspansi industri armada robot otonom

Gambaran kategori

Data & simulasi
- Menyediakan fondasi bagi pembelajaran robot; robot membutuhkan data pelatihan dalam jumlah besar, tetapi pengumpulan data nyata lambat dan mahal
- Terdiri dari tiga subpasar:
  - Data pelatihan sintetis — robotika: alat untuk membuat dataset sintetis seperti gambar, data sensor, dan adegan 3D tanpa pengumpulan dunia nyata yang mahal
  - Penyedia data demonstrasi robot: perusahaan yang menangkap data nyata seperti data teleoperasi, lintasan gerak, dan video untuk imitation learning
  - Platform simulasi robotika: lingkungan virtual untuk melatih, menguji, dan memvalidasi robot sebelum diterapkan secara fisik
- Kelangkaan data menjadi hambatan utama Physical AI, karena masalah biaya dan ketersediaan membuat akses ke data pelatihan nyata menjadi sulit
  - Pasar-pasar ini memiliki skor Mosaic rata-rata sekitar 600 (masuk separuh teratas dari sisi momentum pasar)
  - 50% perusahaan telah memasuki tahap deployment, menunjukkan bahwa infrastruktur data untuk Physical AI telah matang dari riset menuju kelayakan komersial
- Banyak perusahaan bergantung pada data sintetis dan simulasi, dengan Nvidia memimpin pasar
  - Namun, data sintetis saja tidak cukup; data robot nyata tetap penting untuk melatih model yang andal
  - Scale menerima investasi sebesar $16,4 miliar dan berada di 1% teratas dalam skor Mosaic
  - Scale memperluas bisnis pelabelan datanya ke pengembangan model dengan menggabungkan pembuatan data sintetis dan pengumpulan data nyata, termasuk teleoperasi manusia terhadap robot serta data sensor dari lingkungan fisik
- Perusahaan-perusahaan baru mencari sumber data baru untuk mengatasi kekurangan data yang ada
  - General Intuition mengumpulkan investasi $134 juta untuk melatih model menggunakan video gameplay yang dapat diterapkan pada sistem robotika
  - micro1 menerima investasi $35 juta dengan valuasi $500 juta untuk membangun dataset pelatihan robotika terbesar di dunia dari video interaksi manusia
- Tanpa dataset proprietari atau platform simulasi, perusahaan robotika berisiko harus melisensikan dari pemimpin pasar atau tertinggal dalam jenis data penting seperti sentuhan, tekanan, dan gerakan fisik
Pendekatan terhadap model
- Memberikan kemampuan penglihatan, penalaran, dan tindakan kepada robot, dengan tiap model dibangun di atas model lain
- Memungkinkan robot beradaptasi dengan tugas baru alih-alih bergantung pada pemrograman yang kaku
- Terdiri dari tiga subpasar:
  - Pengembang vision-language model (VLM): model multimodal yang menggabungkan pemahaman visual dan bahasa alami, berfungsi sebagai lapisan persepsi robot
  - Pengembang vision-language-action (VLA) model: sistem AI yang dibangun di atas VLM dan menggabungkan persepsi visual, pemahaman bahasa, serta kontrol motorik untuk langsung menerjemahkan perintah menjadi tindakan fisik
  - Pengembang world model AI: model yang mensimulasikan perubahan lingkungan untuk memprediksi relasi spasial, hukum fisika, dan hubungan sebab-akibat
- Physical AI menggeser robotika dari pemrograman yang di-hardcode menjadi sistem yang fleksibel dan adaptif terhadap tugas, dengan model VLA muncul sebagai arsitektur terdepan
  - Perusahaan robot humanoid terkemuka seperti Figure, 1X, dan Galbot sedang membangun model VLA proprietari
  - Perusahaan big tech seperti Nvidia dan Meta sedang mengembangkan model untuk lisensi komersial kepada produsen robot
- World model berpotensi menjadi terobosan sejati dengan menambahkan penalaran prediktif
  - Perusahaan seperti World Labs dan Runway sedang membangun world model
  - Berbeda dari VLA yang bereaksi terhadap input langsung, world model mensimulasikan perubahan lingkungan seiring waktu
  - Ini memungkinkan robot memprediksi hasil, merencanakan tindakan multilangkah, dan pulih dari kesalahan
Foundation model
- Menggabungkan data dan arsitektur untuk menghadirkan kecerdasan robot pralatih yang mampu melakukan persepsi, penalaran, dan tindakan
- Sebagiannya adalah model serbaguna untuk manipulasi, sementara lainnya lebih terspesialisasi
- Pengembang dapat melisensikan dan menerapkan kecerdasan ini tanpa harus membangunnya dari nol
- Terdiri dari tiga subpasar:
  - Pengembang robot foundation model: model serbaguna yang membantu robot melihat, berpikir, dan bergerak di berbagai perangkat keras
  - Pengembang foundation model untuk autonomous driving: dilatih dengan dataset berkendara skala besar untuk mengintegrasikan persepsi, prediksi, perencanaan, dan kontrol, serta menggantikan sistem otonom lama untuk robotaxi, truk, dan pengiriman
  - Pengembang model kolaborasi multi-robot: algoritme multi-agen yang memungkinkan kawanan robot bekerja sama dengan menangani pembagian tugas, penghindaran tabrakan, dan pengambilan keputusan terdistribusi
- Pasar foundation model sangat dinamis
  - Raksasa teknologi AS (Microsoft, Google, Amazon) dan pemain terdepan Tiongkok (Huawei, Baidu) bersaing dengan startup yang banyak diperhatikan seperti DeepSeek dan Physical Intelligence
- Banyak perusahaan bekerja di beberapa jenis foundation model sekaligus
  - Data pelatihan dari satu domain dapat membantu meningkatkan performa model di domain lain
  - Nvidia adalah satu-satunya perusahaan yang aktif di ketiga kategori foundation model, memosisikan diri sebagai infrastruktur bagi seluruh stack Physical AI
- Kolaborasi multi-robot adalah frontier berikutnya
  - Misalnya skenario di gudang tempat humanoid, autonomous mobile robot, dan forklift otonom bekerja bersama
  - Kolaborasi antarberbagai jenis robot membutuhkan lapisan orkestrasi yang mengelola tugas, sumber daya, dan penghindaran tabrakan tanpa kontrol terpusat
  - Hanya segelintir startup seperti Field AI dan Intrinsic, serta beberapa perusahaan big tech, yang mengejarnya
  - Sebagian besar pekerjaan masih berada pada tahap riset, bukan deployment komersial
- Perusahaan dengan model proprietari dapat memperoleh margin lebih tinggi melalui diferensiasi dan integrasi vertikal
- Perusahaan yang melisensikan AI pihak ketiga bisa mendapat manfaat dari biaya yang lebih rendah akibat komoditisasi model, tetapi mereka bersaing lewat kecepatan deployment dan kualitas integrasi, bukan teknologi inti
Observability
- Menangkap apa yang terjadi saat robot beroperasi di produksi, menjembatani kesenjangan antara pengembangan di laboratorium dan deployment di dunia nyata
- Platform observability robotika: platform untuk memantau, men-debug, dan mengoptimalkan robot dalam pengembangan maupun produksi
- Saat robot gagal atau berperilaku tak terduga, engineer dapat memutar ulang insiden, menemukan penyebabnya, lalu mendorong perbaikan
- Edge case nyata dapat dimasukkan kembali ke simulasi dan pelatihan untuk memperbaiki model dan meningkatkan performa
- Foxglove dan Formant adalah contoh representatif yang melacak performa, menganalisis kegagalan, dan mengalirkan kembali insight deployment ke dataset pelatihan, simulasi, dan model
- Perusahaan dengan observability yang kuat dapat belajar dari kegagalan dan memperbaiki model dengan cepat
- Situasi tak terduga berubah menjadi keunggulan pembelajaran, menjadi faktor kunci yang membedakan sistem siap produksi dari prototipe laboratorium

Peta pasar model Physical AI: sisi persaingan di balik kecerdasan robot

Poin utama

Gambaran kategori

Data & simulasi

Pendekatan terhadap model

Foundation model

Observability

Bacaan terkait

Belum ada komentar.