DreamPolish: Domeinscoreverfijning met progressieve geometriegeneratie

DreamPolish: Domain Score Distillation With Progressive Geometry Generation

November 3, 2024
Auteurs: Yean Cheng, Ziqi Cai, Ming Ding, Wendi Zheng, Shiyu Huang, Yuxiao Dong, Jie Tang, Boxin Shi
cs.AI

Samenvatting

We introduceren DreamPolish, een tekst-naar-3D-generatiemodel dat uitblinkt in het produceren van verfijnde geometrie en hoogwaardige texturen. In de geometrieconstructiefase maakt onze aanpak gebruik van meerdere neurale representaties om de stabiliteit van het synthese proces te verbeteren. In plaats van uitsluitend te vertrouwen op een op zicht geconditioneerde diffusieprior in de nieuw gesamplede weergaven, wat vaak leidt tot ongewenste artefacten in het geometrische oppervlak, voegen we een extra normalen schatter toe om de geometrische details te verfijnen, geconditioneerd op standpunten met variërende gezichtsvelden. We stellen voor om een oppervlaktepolijstfase toe te voegen met slechts een paar trainingsstappen, die effectief de artefacten kan verfijnen die worden toegeschreven aan beperkte begeleiding van eerdere stadia en 3D-objecten kan produceren met meer wenselijke geometrie. Het belangrijkste onderwerp van textuurgeneratie met behulp van vooraf getrainde tekst-naar-afbeeldingmodellen is om een geschikt domein te vinden in de uitgebreide latente distributie van deze modellen die fotorealistische en consistente renderingen bevat. In de textuurgeneratiefase introduceren we een nieuw scoredestillatie-objectief, namelijk domeinscoredestillatie (DSD), om neurale representaties naar zo'n domein te leiden. We halen inspiratie uit de classifier-vrije begeleiding (CFG) in tekstgeconditioneerde beeldgeneratietaken en tonen aan dat CFG en variatiedistributiebegeleiding verschillende aspecten vertegenwoordigen in gradientbegeleiding en beide essentiële domeinen zijn voor de verbetering van textuurkwaliteit. Uitgebreide experimenten tonen aan dat ons voorgestelde model 3D-assets kan produceren met gepolijste oppervlakken en fotorealistische texturen, waarbij het bestaande state-of-the-art methoden overtreft.
English
We introduce DreamPolish, a text-to-3D generation model that excels in producing refined geometry and high-quality textures. In the geometry construction phase, our approach leverages multiple neural representations to enhance the stability of the synthesis process. Instead of relying solely on a view-conditioned diffusion prior in the novel sampled views, which often leads to undesired artifacts in the geometric surface, we incorporate an additional normal estimator to polish the geometry details, conditioned on viewpoints with varying field-of-views. We propose to add a surface polishing stage with only a few training steps, which can effectively refine the artifacts attributed to limited guidance from previous stages and produce 3D objects with more desirable geometry. The key topic of texture generation using pretrained text-to-image models is to find a suitable domain in the vast latent distribution of these models that contains photorealistic and consistent renderings. In the texture generation phase, we introduce a novel score distillation objective, namely domain score distillation (DSD), to guide neural representations toward such a domain. We draw inspiration from the classifier-free guidance (CFG) in textconditioned image generation tasks and show that CFG and variational distribution guidance represent distinct aspects in gradient guidance and are both imperative domains for the enhancement of texture quality. Extensive experiments show our proposed model can produce 3D assets with polished surfaces and photorealistic textures, outperforming existing state-of-the-art methods.

Summary

AI-Generated Summary

PDF91November 13, 2024