Die Nutzung der Lokalität zur Steigerung der Stichproben-Effizienz in der robotergestützten Manipulation.
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation
June 15, 2024
Autoren: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI
Zusammenfassung
Angesichts der hohen Kosten für die Erfassung von Roboterdaten in der realen Welt ist die Effizienz bei der Datenerfassung in der Robotik ein durchgehend überzeugendes Ziel. In diesem Artikel stellen wir SGRv2 vor, ein Imitationslern-Framework, das die Datenerfassungseffizienz durch verbesserte visuelle und Aktionsrepräsentationen steigert. Zentral für das Design von SGRv2 ist die Integration eines kritischen induktiven Bias - der Aktionslokalität, der besagt, dass die Aktionen des Roboters hauptsächlich von dem Zielobjekt und dessen Interaktionen mit der lokalen Umgebung beeinflusst werden. Umfangreiche Experimente in simulierten und realen Umgebungen zeigen, dass die Aktionslokalität entscheidend ist, um die Datenerfassungseffizienz zu steigern. SGRv2 zeichnet sich in RLBench-Aufgaben mit Keyframe-Steuerung aus, wobei lediglich 5 Demonstrationen verwendet werden, und übertrifft die RVT-Basislinie in 23 von 26 Aufgaben. Darüber hinaus liegt die Erfolgsquote von SGRv2 bei der Bewertung anhand von ManiSkill2 und MimicGen mit dichter Steuerung um 2,54-mal höher als die von SGR. In realen Umgebungen kann SGRv2 mit nur acht Demonstrationen eine Vielzahl von Aufgaben mit einer deutlich höheren Erfolgsquote als Basismodelle ausführen. Projektwebsite: http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample
efficiency is a consistently compelling pursuit in robotics. In this paper, we
introduce SGRv2, an imitation learning framework that enhances sample
efficiency through improved visual and action representations. Central to the
design of SGRv2 is the incorporation of a critical inductive bias-action
locality, which posits that robot's actions are predominantly influenced by the
target object and its interactions with the local environment. Extensive
experiments in both simulated and real-world settings demonstrate that action
locality is essential for boosting sample efficiency. SGRv2 excels in RLBench
tasks with keyframe control using merely 5 demonstrations and surpasses the RVT
baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and
MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR.
In real-world environments, with only eight demonstrations, SGRv2 can perform a
variety of tasks at a markedly higher success rate compared to baseline models.
Project website: http://sgrv2-robot.github.ioSummary
AI-Generated Summary