MVPaint: Synchronisierte Multi-View-Diffusion zum Malen von beliebigen 3D-Objekten

MVPaint: Synchronized Multi-View Diffusion for Painting Anything 3D

November 4, 2024
Autoren: Wei Cheng, Juncheng Mu, Xianfang Zeng, Xin Chen, Anqi Pang, Chi Zhang, Zhibin Wang, Bin Fu, Gang Yu, Ziwei Liu, Liang Pan
cs.AI

Zusammenfassung

Die Texturierung ist ein entscheidender Schritt im 3D-Asset-Produktionsworkflow, der die visuelle Attraktivität und Vielfalt von 3D-Assets verbessert. Trotz der jüngsten Fortschritte bei der Text-in-Textur (T2T)-Generierung liefern bestehende Methoden oft unterdurchschnittliche Ergebnisse, hauptsächlich aufgrund lokaler Diskontinuitäten, Inkonsistenzen über mehrere Ansichten hinweg und ihrer starken Abhängigkeit von den Ergebnissen des UV-Entfaltens. Um diese Herausforderungen anzugehen, schlagen wir ein neuartiges Generierungs-Verfeinerungs-3D-Texturierungsframework namens MVPaint vor, das hochauflösende, nahtlose Texturen generieren kann, wobei die Konsistenz über mehrere Ansichten betont wird. MVPaint besteht hauptsächlich aus drei Schlüsselmodulen. 1) Synchronisierte Multi-View-Generierung (SMG). MVPaint generiert zunächst gleichzeitig Multi-View-Bilder, indem ein SMG-Modell auf ein 3D-Mesh-Modell angewendet wird, was zu groben Texturierungsergebnissen mit unpainted Teilen aufgrund fehlender Beobachtungen führt. 2) Räumlich-orientiertes 3D-Inpainting (S3I). Um eine vollständige 3D-Texturierung sicherzustellen, führen wir die S3I-Methode ein, die speziell entwickelt wurde, um effektiv Bereiche zu texturieren, die zuvor nicht beobachtet wurden. 3) UV-Verfeinerung (UVR). Darüber hinaus verwendet MVPaint ein UVR-Modul, um die Texturqualität im UV-Raum zu verbessern, das zunächst eine UV-Raum-Super-Auflösung durchführt, gefolgt von einem räumlich-orientierten Nahtglättungsalgorithmus zur Überarbeitung von räumlichen Texturierungsinkonsistenzen, die durch das UV-Entfalten verursacht wurden. Darüber hinaus etablieren wir zwei T2T-Evaluierungsbenchmarks: den Objaverse T2T-Benchmark und den GSO T2T-Benchmark, basierend auf ausgewählten hochwertigen 3D-Meshes aus dem Objaverse-Datensatz und dem gesamten GSO-Datensatz, jeweils. Umfangreiche experimentelle Ergebnisse zeigen, dass MVPaint bestehende State-of-the-Art-Methoden übertrifft. Insbesondere konnte MVPaint hochwertige Texturen mit minimalen Janus-Problemen und stark verbesserten Konsistenzen über verschiedene Ansichten hinweg generieren.
English
Texturing is a crucial step in the 3D asset production workflow, which enhances the visual appeal and diversity of 3D assets. Despite recent advancements in Text-to-Texture (T2T) generation, existing methods often yield subpar results, primarily due to local discontinuities, inconsistencies across multiple views, and their heavy dependence on UV unwrapping outcomes. To tackle these challenges, we propose a novel generation-refinement 3D texturing framework called MVPaint, which can generate high-resolution, seamless textures while emphasizing multi-view consistency. MVPaint mainly consists of three key modules. 1) Synchronized Multi-view Generation (SMG). Given a 3D mesh model, MVPaint first simultaneously generates multi-view images by employing an SMG model, which leads to coarse texturing results with unpainted parts due to missing observations. 2) Spatial-aware 3D Inpainting (S3I). To ensure complete 3D texturing, we introduce the S3I method, specifically designed to effectively texture previously unobserved areas. 3) UV Refinement (UVR). Furthermore, MVPaint employs a UVR module to improve the texture quality in the UV space, which first performs a UV-space Super-Resolution, followed by a Spatial-aware Seam-Smoothing algorithm for revising spatial texturing discontinuities caused by UV unwrapping. Moreover, we establish two T2T evaluation benchmarks: the Objaverse T2T benchmark and the GSO T2T benchmark, based on selected high-quality 3D meshes from the Objaverse dataset and the entire GSO dataset, respectively. Extensive experimental results demonstrate that MVPaint surpasses existing state-of-the-art methods. Notably, MVPaint could generate high-fidelity textures with minimal Janus issues and highly enhanced cross-view consistency.

Summary

AI-Generated Summary

PDF231November 13, 2024