로봇 조작에서 샘플 효율성을 향상시키기 위한 지역성 활용
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation
June 15, 2024
저자: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI
초록
로봇 데이터를 실제 세계에서 수집하는 데 드는 높은 비용을 감안할 때, 샘플 효율성은 로봇 공학에서 지속적으로 매력적인 추구 대상입니다. 본 논문에서는 시각 및 행동 표현을 개선하여 샘플 효율성을 향상시키는 모방 학습 프레임워크인 SGRv2를 소개합니다. SGRv2의 설계의 핵심은 핵심 귀납 편향인 행동 국부성을 통합하는 것인데, 이는 로봇의 행동이 주로 대상 물체 및 지역 환경과의 상호 작용에 영향을 받는다는 가정을 제시합니다. 모의 실험과 실제 환경에서의 광범위한 실험 결과는 행동 국부성이 샘플 효율성 향상에 중요하다는 것을 입증합니다. SGRv2는 키 프레임 제어를 사용하여 RLBench 작업에서 단순히 5개의 데모로 우수한 성과를 거두며 26개 작업 중 23개에서 RVT 기준선을 능가합니다. 또한 ManiSkill2 및 MimicGen에서 밀도 제어를 사용하여 평가할 때, SGRv2의 성공률은 SGR의 2.54배입니다. 실제 환경에서는 단 8개의 데모로도 SGRv2가 기준 모델과 비교하여 현저히 높은 성공률로 다양한 작업을 수행할 수 있습니다. 프로젝트 웹사이트: http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample
efficiency is a consistently compelling pursuit in robotics. In this paper, we
introduce SGRv2, an imitation learning framework that enhances sample
efficiency through improved visual and action representations. Central to the
design of SGRv2 is the incorporation of a critical inductive bias-action
locality, which posits that robot's actions are predominantly influenced by the
target object and its interactions with the local environment. Extensive
experiments in both simulated and real-world settings demonstrate that action
locality is essential for boosting sample efficiency. SGRv2 excels in RLBench
tasks with keyframe control using merely 5 demonstrations and surpasses the RVT
baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and
MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR.
In real-world environments, with only eight demonstrations, SGRv2 can perform a
variety of tasks at a markedly higher success rate compared to baseline models.
Project website: http://sgrv2-robot.github.ioSummary
AI-Generated Summary