Adversariale Datenerfassung: Menschlich-kollaborative Störungen für effizientes und robustes robotisches Imitationslernen
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning
March 14, 2025
Autoren: Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren
cs.AI
Zusammenfassung
Das Streben nach Dateneffizienz, bei dem Qualität Quantität überwiegt, hat sich als Eckpfeiler in der robotischen Manipulation etabliert, insbesondere angesichts der hohen Kosten, die mit der Datenerfassung in der realen Welt verbunden sind. Wir schlagen vor, dass die Maximierung der Informationsdichte einzelner Demonstrationen die Abhängigkeit von groß angelegten Datensätzen drastisch verringern und gleichzeitig die Aufgabenleistung verbessern kann. Zu diesem Zweck führen wir Adversarial Data Collection (ADC) ein, ein Human-in-the-Loop (HiL)-Framework, das die robotische Datenerfassung durch Echtzeit-Interaktionen zwischen Mensch und Umgebung neu definiert. Im Gegensatz zu konventionellen Pipelines, die statische Demonstrationen passiv aufzeichnen, setzt ADC ein kollaboratives Störungsparadigma ein: Während einer einzelnen Episode verändert ein adversarischer Operator dynamisch Objektzustände, Umweltbedingungen und sprachliche Befehle, während der Tele-Operator seine Aktionen anpasst, um diese sich entwickelnden Herausforderungen zu bewältigen. Dieser Prozess komprimiert vielfältige Fehler-Wiederherstellungs-Verhaltensweisen, zusammengesetzte Aufgabenvariationen und Umweltstörungen in minimalen Demonstrationen. Unsere Experimente zeigen, dass mit ADC trainierte Modelle eine überlegene kompositionelle Generalisierung auf unbekannte Aufgabenanweisungen, eine verbesserte Robustheit gegenüber wahrnehmungsbezogenen Störungen und emergente Fehler-Wiederherstellungsfähigkeiten erreichen. Bemerkenswerterweise übertreffen Modelle, die mit nur 20 % des durch ADC gesammelten Demonstrationsvolumens trainiert wurden, traditionelle Ansätze, die vollständige Datensätze verwenden, deutlich. Diese Fortschritte überbrücken die Lücke zwischen datenzentrierten Lernparadigmen und praktischem robotischem Einsatz und zeigen, dass strategische Datenerfassung, nicht nur nachträgliche Verarbeitung, entscheidend für skalierbares, reales Roboterlernen ist. Zusätzlich erstellen wir einen groß angelegten ADC-Robotics-Datensatz, der reale Manipulationsaufgaben mit adversarischen Störungen umfasst. Dieser Benchmark wird Open-Source sein, um Fortschritte im robotischen Imitationslernen zu fördern.
English
The pursuit of data efficiency, where quality outweighs quantity, has emerged
as a cornerstone in robotic manipulation, especially given the high costs
associated with real-world data collection. We propose that maximizing the
informational density of individual demonstrations can dramatically reduce
reliance on large-scale datasets while improving task performance. To this end,
we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework
that redefines robotic data acquisition through real-time, bidirectional
human-environment interactions. Unlike conventional pipelines that passively
record static demonstrations, ADC adopts a collaborative perturbation paradigm:
during a single episode, an adversarial operator dynamically alters object
states, environmental conditions, and linguistic commands, while the
tele-operator adaptively adjusts actions to overcome these evolving challenges.
This process compresses diverse failure-recovery behaviors, compositional task
variations, and environmental perturbations into minimal demonstrations. Our
experiments demonstrate that ADC-trained models achieve superior compositional
generalization to unseen task instructions, enhanced robustness to perceptual
perturbations, and emergent error recovery capabilities. Strikingly, models
trained with merely 20% of the demonstration volume collected through ADC
significantly outperform traditional approaches using full datasets. These
advances bridge the gap between data-centric learning paradigms and practical
robotic deployment, demonstrating that strategic data acquisition, not merely
post-hoc processing, is critical for scalable, real-world robot learning.
Additionally, we are curating a large-scale ADC-Robotics dataset comprising
real-world manipulation tasks with adversarial perturbations. This benchmark
will be open-sourced to facilitate advancements in robotic imitation learning.Summary
AI-Generated Summary