Oggetti Non Comuni in 3D

UnCommon Objects in 3D

January 13, 2025
Autori: Xingchen Liu, Piyush Tayal, Jianyuan Wang, Jesus Zarzar, Tom Monnier, Konstantinos Tertikas, Jiali Duan, Antoine Toisoul, Jason Y. Zhang, Natalia Neverova, Andrea Vedaldi, Roman Shapovalov, David Novotny
cs.AI

Abstract

Introduciamo Uncommon Objects in 3D (uCO3D), un nuovo dataset centrato sugli oggetti per l'apprendimento profondo in 3D e l'IA generativa in 3D. uCO3D è la più grande raccolta pubblicamente disponibile di video ad alta risoluzione di oggetti con annotazioni in 3D che garantisce una copertura completa a 360 gradi. uCO3D è significativamente più diverso di MVImgNet e CO3Dv2, coprendo più di 1.000 categorie di oggetti. È anche di qualità superiore, grazie a approfonditi controlli di qualità sia dei video raccolti che delle annotazioni in 3D. Simile a dataset analoghi, uCO3D contiene annotazioni per pose della telecamera in 3D, mappe di profondità e nuvole di punti sparse. Inoltre, ogni oggetto è dotato di didascalia e di una ricostruzione 3D tramite Splat gaussiano. Alleniamo diversi modelli 3D di grandi dimensioni su MVImgNet, CO3Dv2 e uCO3D e otteniamo risultati superiori utilizzando quest'ultimo, dimostrando che uCO3D è migliore per le applicazioni di apprendimento.
English
We introduce Uncommon Objects in 3D (uCO3D), a new object-centric dataset for 3D deep learning and 3D generative AI. uCO3D is the largest publicly-available collection of high-resolution videos of objects with 3D annotations that ensures full-360^{circ} coverage. uCO3D is significantly more diverse than MVImgNet and CO3Dv2, covering more than 1,000 object categories. It is also of higher quality, due to extensive quality checks of both the collected videos and the 3D annotations. Similar to analogous datasets, uCO3D contains annotations for 3D camera poses, depth maps and sparse point clouds. In addition, each object is equipped with a caption and a 3D Gaussian Splat reconstruction. We train several large 3D models on MVImgNet, CO3Dv2, and uCO3D and obtain superior results using the latter, showing that uCO3D is better for learning applications.

Summary

AI-Generated Summary

PDF122January 14, 2025