ChatPaper.aiChatPaper

Any6D: Modellfreie 6D-Positionsschätzung von neuartigen Objekten

Any6D: Model-free 6D Pose Estimation of Novel Objects

March 24, 2025
Autoren: Taeyeop Lee, Bowen Wen, Minjun Kang, Gyuree Kang, In So Kweon, Kuk-Jin Yoon
cs.AI

Zusammenfassung

Wir stellen Any6D vor, ein modellfreies Framework für die 6D-Posenschätzung von Objekten, das nur ein einzelnes RGB-D-Ankerbild benötigt, um sowohl die 6D-Position als auch die Größe unbekannter Objekte in neuen Szenen zu schätzen. Im Gegensatz zu bestehenden Methoden, die auf texturierten 3D-Modellen oder mehreren Blickwinkeln basieren, nutzt Any6D einen gemeinsamen Objektausrichtungsprozess, um die 2D-3D-Ausrichtung und die metrische Skalenschätzung zu verbessern und so die Genauigkeit der Posenschätzung zu erhöhen. Unser Ansatz integriert eine Render-and-Compare-Strategie, um Posenschätzungen zu generieren und zu verfeinern, was eine robuste Leistung in Szenarien mit Verdeckungen, nicht überlappenden Ansichten, unterschiedlichen Lichtverhältnissen und großen umgebungsbedingten Variationen ermöglicht. Wir evaluieren unsere Methode anhand von fünf anspruchsvollen Datensätzen: REAL275, Toyota-Light, HO3D, YCBINEOAT und LM-O, und zeigen ihre Wirksamkeit, indem sie state-of-the-art Methoden für die Posenschätzung neuartiger Objekte deutlich übertrifft. Projektseite: https://taeyeop.com/any6d
English
We introduce Any6D, a model-free framework for 6D object pose estimation that requires only a single RGB-D anchor image to estimate both the 6D pose and size of unknown objects in novel scenes. Unlike existing methods that rely on textured 3D models or multiple viewpoints, Any6D leverages a joint object alignment process to enhance 2D-3D alignment and metric scale estimation for improved pose accuracy. Our approach integrates a render-and-compare strategy to generate and refine pose hypotheses, enabling robust performance in scenarios with occlusions, non-overlapping views, diverse lighting conditions, and large cross-environment variations. We evaluate our method on five challenging datasets: REAL275, Toyota-Light, HO3D, YCBINEOAT, and LM-O, demonstrating its effectiveness in significantly outperforming state-of-the-art methods for novel object pose estimation. Project page: https://taeyeop.com/any6d

Summary

AI-Generated Summary

PDF22March 27, 2025