Any6D: Modellfreie 6D-Positionsschätzung von neuartigen Objekten
Any6D: Model-free 6D Pose Estimation of Novel Objects
March 24, 2025
Autoren: Taeyeop Lee, Bowen Wen, Minjun Kang, Gyuree Kang, In So Kweon, Kuk-Jin Yoon
cs.AI
Zusammenfassung
Wir stellen Any6D vor, ein modellfreies Framework für die 6D-Posenschätzung von Objekten, das nur ein einzelnes RGB-D-Ankerbild benötigt, um sowohl die 6D-Position als auch die Größe unbekannter Objekte in neuen Szenen zu schätzen. Im Gegensatz zu bestehenden Methoden, die auf texturierten 3D-Modellen oder mehreren Blickwinkeln basieren, nutzt Any6D einen gemeinsamen Objektausrichtungsprozess, um die 2D-3D-Ausrichtung und die metrische Skalenschätzung zu verbessern und so die Genauigkeit der Posenschätzung zu erhöhen. Unser Ansatz integriert eine Render-and-Compare-Strategie, um Posenschätzungen zu generieren und zu verfeinern, was eine robuste Leistung in Szenarien mit Verdeckungen, nicht überlappenden Ansichten, unterschiedlichen Lichtverhältnissen und großen umgebungsbedingten Variationen ermöglicht. Wir evaluieren unsere Methode anhand von fünf anspruchsvollen Datensätzen: REAL275, Toyota-Light, HO3D, YCBINEOAT und LM-O, und zeigen ihre Wirksamkeit, indem sie state-of-the-art Methoden für die Posenschätzung neuartiger Objekte deutlich übertrifft. Projektseite: https://taeyeop.com/any6d
English
We introduce Any6D, a model-free framework for 6D object pose estimation that
requires only a single RGB-D anchor image to estimate both the 6D pose and size
of unknown objects in novel scenes. Unlike existing methods that rely on
textured 3D models or multiple viewpoints, Any6D leverages a joint object
alignment process to enhance 2D-3D alignment and metric scale estimation for
improved pose accuracy. Our approach integrates a render-and-compare strategy
to generate and refine pose hypotheses, enabling robust performance in
scenarios with occlusions, non-overlapping views, diverse lighting conditions,
and large cross-environment variations. We evaluate our method on five
challenging datasets: REAL275, Toyota-Light, HO3D, YCBINEOAT, and LM-O,
demonstrating its effectiveness in significantly outperforming state-of-the-art
methods for novel object pose estimation. Project page:
https://taeyeop.com/any6dSummary
AI-Generated Summary