- Google DeepMind memperkenalkan RoboCat, yang belajar sendiri sambil melakukan berbagai tugas melalui lengan robot.
- Ini didasarkan pada Gato, model multimodal yang dapat beroperasi baik di lingkungan nyata maupun simulasi (
gato berarti 'kucing' dalam bahasa Spanyol).
- Untuk peningkatan mandiri, pertama-tama RoboCat mengumpulkan data nyata untuk tugas baru.
- Berdasarkan data nyata tersebut, model dasar di-fine-tune untuk membuat agen turunan.
- Agen baru kemudian berlatih sekitar 10 ribu kali untuk membuat dataset pelatihan.
- Data nyata dan data yang dihasilkan sendiri digabungkan ke dalam dataset pelatihan RoboCat.
- Melatih versi baru RoboCat.
- Melalui cara ini, RoboCat dapat beradaptasi dalam hitungan jam ke lengan robot baru yang memiliki lebih banyak sendi atau lebih banyak penjepit.
- Selain itu, tercipta siklus pembelajaran yang baik: model awal yang hanya menunjukkan tingkat keberhasilan 36% pada tugas tertentu meningkat lebih dari dua kali lipat hingga mencapai 74%.
3 komentar
Akhirnya, terbuka juga panggung bagi kecerdasan buatan untuk bertemu dan mengalami dunia nyata.
Komentar di thread HN benar-benar lucu.
Saya juga langsung terpikir hal yang hampir sama, yaitu
Apa cuma saya yang mengira ini akan menjadi kucing robot? Agak mengecewakan...Setidaknya akan bagus kalau mereka menempelkan stiker kucing pada lengan robot itu.
Kalau diringkas dari makalahnya, hasilnya seperti ini.
RoboCat adalah agen berbasis peningkatan diri untuk manipulasi robot. Agen ini dilatih menggunakan dataset tugas robot yang besar dan beragam, dari banyak simulasi serta lengan robot nyata.
Tujuan utama RoboCat adalah sebagai berikut.
Hasil utamanya adalah sebagai berikut.
Singkatnya, RoboCat, agen berbasis peningkatan diri untuk manipulasi robot yang dilatih dengan dataset besar dan beragam, menunjukkan bahwa ia dapat menggeneralisasi ke tugas dan robot baru dengan data minimal melalui fine-tuning dan peningkatan diri. Kemampuannya memanfaatkan pengalaman robot yang heterogen dalam skala besar memiliki potensi untuk mentransformasi pembelajaran robot.