Het benutten van de nabijheid om de steekproefefficiëntie te verhogen bij robotmanipulatie.

Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation

June 15, 2024
Auteurs: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI

Samenvatting

Gezien de hoge kosten van het verzamelen van robotgegevens in de echte wereld, is sample-efficiëntie een voortdurend overtuigende zoektocht in de robotica. In dit artikel introduceren we SGRv2, een imitatieleringskader dat de sample-efficiëntie verbetert door verbeterde visuele en actierepresentaties. Centraal in het ontwerp van SGRv2 staat de incorporatie van een cruciale inductieve bias - actielokaliteit, die stelt dat de acties van de robot voornamelijk worden beïnvloed door het doelobject en de interacties ervan met de lokale omgeving. Uitgebreide experimenten in zowel gesimuleerde als echte omgevingen tonen aan dat actielokaliteit essentieel is voor het verhogen van de sample-efficiëntie. SGRv2 blinkt uit in RLBench-taken met keyframe-besturing met slechts 5 demonstraties en overtreft de RVT-baseline in 23 van de 26 taken. Bovendien, bij evaluatie op ManiSkill2 en MimicGen met dichte besturing, is het succespercentage van SGRv2 2,54 keer dat van SGR. In echte omgevingen kan SGRv2 met slechts acht demonstraties een verscheidenheid aan taken uitvoeren met een aanzienlijk hoger succespercentage in vergelijking met basismodellen. Projectwebsite: http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample efficiency is a consistently compelling pursuit in robotics. In this paper, we introduce SGRv2, an imitation learning framework that enhances sample efficiency through improved visual and action representations. Central to the design of SGRv2 is the incorporation of a critical inductive bias-action locality, which posits that robot's actions are predominantly influenced by the target object and its interactions with the local environment. Extensive experiments in both simulated and real-world settings demonstrate that action locality is essential for boosting sample efficiency. SGRv2 excels in RLBench tasks with keyframe control using merely 5 demonstrations and surpasses the RVT baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR. In real-world environments, with only eight demonstrations, SGRv2 can perform a variety of tasks at a markedly higher success rate compared to baseline models. Project website: http://sgrv2-robot.github.io

Summary

AI-Generated Summary

PDF21November 16, 2024