Exploiter la localité pour améliorer l'efficacité de l'échantillonnage dans la manipulation robotique.

Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation

June 15, 2024
Auteurs: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI

Résumé

Étant donné le coût élevé de la collecte de données robotiques dans le monde réel, l'efficacité de l'échantillonnage est une quête constante en robotique. Dans cet article, nous présentons SGRv2, un cadre d'apprentissage par imitation qui améliore l'efficacité de l'échantillonnage grâce à des représentations visuelles et d'actions améliorées. Au cœur de la conception de SGRv2 se trouve l'incorporation d'un biais inductif critique - la localité de l'action - qui postule que les actions du robot sont principalement influencées par l'objet cible et ses interactions avec l'environnement local. Des expériences approfondies menées dans des environnements simulés et réels démontrent que la localité de l'action est essentielle pour améliorer l'efficacité de l'échantillonnage. SGRv2 excelle dans les tâches de RLBench avec un contrôle par images clés en utilisant seulement 5 démonstrations et dépasse la ligne de base RVT dans 23 des 26 tâches. De plus, lorsqu'évalué sur ManiSkill2 et MimicGen en utilisant un contrôle dense, le taux de réussite de SGRv2 est 2,54 fois supérieur à celui de SGR. Dans des environnements réels, avec seulement huit démonstrations, SGRv2 peut effectuer une variété de tâches à un taux de réussite nettement plus élevé par rapport aux modèles de base. Site web du projet : http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample efficiency is a consistently compelling pursuit in robotics. In this paper, we introduce SGRv2, an imitation learning framework that enhances sample efficiency through improved visual and action representations. Central to the design of SGRv2 is the incorporation of a critical inductive bias-action locality, which posits that robot's actions are predominantly influenced by the target object and its interactions with the local environment. Extensive experiments in both simulated and real-world settings demonstrate that action locality is essential for boosting sample efficiency. SGRv2 excels in RLBench tasks with keyframe control using merely 5 demonstrations and surpasses the RVT baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR. In real-world environments, with only eight demonstrations, SGRv2 can perform a variety of tasks at a markedly higher success rate compared to baseline models. Project website: http://sgrv2-robot.github.io

Summary

AI-Generated Summary

PDF21November 16, 2024