ChatPaper.aiChatPaper

Hunyuan3D 2.0: Skalierung von Diffusionsmodellen für die Generierung hochauflösender texturierter 3D-Assets

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

January 21, 2025
Autoren: Zibo Zhao, Zeqiang Lai, Qingxiang Lin, Yunfei Zhao, Haolin Liu, Shuhui Yang, Yifei Feng, Mingxin Yang, Sheng Zhang, Xianghui Yang, Huiwen Shi, Sicong Liu, Junta Wu, Yihang Lian, Fan Yang, Ruining Tang, Zebin He, Xinzhou Wang, Jian Liu, Xuhui Zuo, Zhuo Chen, Biwen Lei, Haohan Weng, Jing Xu, Yiling Zhu, Xinhai Liu, Lixin Xu, Changrong Hu, Tianyu Huang, Lifu Wang, Jihong Zhang, Meng Chen, Liang Dong, Yiwen Jia, Yulin Cai, Jiaao Yu, Yixuan Tang, Hao Zhang, Zheng Ye, Peng He, Runzhou Wu, Chao Zhang, Yonghao Tan, Jie Xiao, Yangyu Tao, Jianchen Zhu, Jinbao Xue, Kai Liu, Chongqing Zhao, Xinming Wu, Zhichao Hu, Lei Qin, Jianbing Peng, Zhan Li, Minghui Chen, Xipeng Zhang, Lin Niu, Paige Wang, Yingkai Wang, Haozhao Kuang, Zhongyi Fan, Xu Zheng, Weihao Zhuang, YingPing He, Tian Liu, Yong Yang, Di Wang, Yuhong Liu, Jie Jiang, Jingwei Huang, Chunchao Guo
cs.AI

Zusammenfassung

Wir präsentieren Hunyuan3D 2.0, ein fortschrittliches groß angelegtes 3D-Synthesesystem zur Erzeugung hochauflösender texturierter 3D-Objekte. Dieses System umfasst zwei grundlegende Komponenten: ein groß angelegtes Formgenerierungsmodell - Hunyuan3D-DiT, und ein groß angelegtes Textursynthesemodell - Hunyuan3D-Paint. Das Formgenerierungsmodell, aufgebaut auf einem skalierbaren flussbasierten Diffusionstransformator, zielt darauf ab, Geometrie zu erstellen, die sich ordnungsgemäß mit einem gegebenen Bedingungsbild ausrichtet und somit eine solide Grundlage für nachgelagerte Anwendungen schafft. Das Textursynthesemodell, das von starken geometrischen und diffusiven Prioritäten profitiert, erstellt hochauflösende und lebendige Texturkarten für entweder generierte oder handgefertigte Gitter. Darüber hinaus haben wir Hunyuan3D-Studio entwickelt - eine vielseitige, benutzerfreundliche Produktionsplattform, die den Prozess der Neuerstellung von 3D-Objekten vereinfacht. Sie ermöglicht sowohl professionellen als auch Amateur-Benutzern, ihre Gitter effizient zu manipulieren oder sogar zu animieren. Wir evaluieren unsere Modelle systematisch und zeigen, dass Hunyuan3D 2.0 bisherige Spitzenmodelle übertrifft, einschließlich der Open-Source-Modelle und Closed-Source-Modelle in Bezug auf Geometriedetails, Bedingungsausrichtung, Texturqualität usw. Hunyuan3D 2.0 wird öffentlich freigegeben, um die Lücken in der Open-Source-3D-Community für groß angelegte generative Grundlagenmodelle zu schließen. Der Code und die vortrainierten Gewichte unserer Modelle sind verfügbar unter: https://github.com/Tencent/Hunyuan3D-2
English
We present Hunyuan3D 2.0, an advanced large-scale 3D synthesis system for generating high-resolution textured 3D assets. This system includes two foundation components: a large-scale shape generation model -- Hunyuan3D-DiT, and a large-scale texture synthesis model -- Hunyuan3D-Paint. The shape generative model, built on a scalable flow-based diffusion transformer, aims to create geometry that properly aligns with a given condition image, laying a solid foundation for downstream applications. The texture synthesis model, benefiting from strong geometric and diffusion priors, produces high-resolution and vibrant texture maps for either generated or hand-crafted meshes. Furthermore, we build Hunyuan3D-Studio -- a versatile, user-friendly production platform that simplifies the re-creation process of 3D assets. It allows both professional and amateur users to manipulate or even animate their meshes efficiently. We systematically evaluate our models, showing that Hunyuan3D 2.0 outperforms previous state-of-the-art models, including the open-source models and closed-source models in geometry details, condition alignment, texture quality, and etc. Hunyuan3D 2.0 is publicly released in order to fill the gaps in the open-source 3D community for large-scale foundation generative models. The code and pre-trained weights of our models are available at: https://github.com/Tencent/Hunyuan3D-2

Summary

AI-Generated Summary

PDF435January 22, 2025