SPAR3D:从单个图像稳定地感知重建3D物体

SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images

January 8, 2025
作者: Zixuan Huang, Mark Boss, Aaryaman Vasishta, James M. Rehg, Varun Jampani
cs.AI

摘要

我们研究单图像三维物体重建问题。最近的研究分为两个方向:基于回归的建模和生成式建模。回归方法能够高效推断可见表面,但在遮挡区域方面表现不佳。生成方法通过建模分布更好地处理不确定区域,但计算成本高且生成结果常常与可见表面不对齐。本文提出了SPAR3D,一种新颖的两阶段方法,旨在兼收并蓄两个方向的优点。SPAR3D的第一阶段利用轻量级点扩散模型生成稀疏的三维点云,具有快速采样速度。第二阶段利用采样的点云和输入图像创建高度详细的网格。我们的两阶段设计实现了对单图像三维任务的概率建模,同时保持了高计算效率和出色的输出保真度。进一步使用点云作为中间表示还允许进行交互式用户编辑。在多样数据集上评估,SPAR3D在0.7秒的推断速度下展现出优于先前最先进方法的性能。项目页面包含代码和模型:https://spar3d.github.io
English
We study the problem of single-image 3D object reconstruction. Recent works have diverged into two directions: regression-based modeling and generative modeling. Regression methods efficiently infer visible surfaces, but struggle with occluded regions. Generative methods handle uncertain regions better by modeling distributions, but are computationally expensive and the generation is often misaligned with visible surfaces. In this paper, we present SPAR3D, a novel two-stage approach aiming to take the best of both directions. The first stage of SPAR3D generates sparse 3D point clouds using a lightweight point diffusion model, which has a fast sampling speed. The second stage uses both the sampled point cloud and the input image to create highly detailed meshes. Our two-stage design enables probabilistic modeling of the ill-posed single-image 3D task while maintaining high computational efficiency and great output fidelity. Using point clouds as an intermediate representation further allows for interactive user edits. Evaluated on diverse datasets, SPAR3D demonstrates superior performance over previous state-of-the-art methods, at an inference speed of 0.7 seconds. Project page with code and model: https://spar3d.github.io

Summary

AI-Generated Summary

论文概述

该文献介绍了一种名为SPAR3D的3D重建器,通过两阶段方法从单视图图像中生成高质量的3D网格。SPAR3D综合了回归建模和生成建模的优点,提高了计算效率和输出保真度,支持用户交互编辑,在各种数据集上展现出卓越性能。

核心贡献

  • 提出了SPAR3D,一种能够从单视图图像中重建高质量3D网格的方法。
  • 结合了回归建模和生成建模,提高了计算效率和输出保真度。
  • 通过点云连接两个阶段,确保了快速重建,同时提供足够的指导以生成高质量网格。

研究背景

该研究背景是关于3D网格重建的研究,综述了多个相关研究论文和方法。许多研究关注了从单个图像生成或重建3D对象的技术,使用了不同的方法如语言引导扩散、梯度场学习等。

研究空白

  • 传统生成方法存在与输入不对齐和低推理速度等缺点。
  • 需要更好的方法来支持单视图图像的高质量3D重建。

技术挑战

  • 如何有效地从单视图图像中生成高质量的3D网格。
  • 如何提高重建的计算效率和输出保真度。

先前方法

  • Nerf、Diffusion-SDF、PointInfinity等先进的3D生成和重建模型。
  • 使用深度学习和神经网络技术,如GANs、点云生成等。

方法学

该研究采用了两阶段方法,包括点采样阶段和网格化阶段,通过不同的Transformer块和自注意力机制实现几何、材质和照明的估计。SPAR3D的推理速度快,支持用户驱动的编辑,为单视图3D重建任务提供了实用解决方案。

理论基础

  • 通过扩散模型生成稀疏点云,避免了传统生成方法的缺点。
  • 使用Monte Carlo积分和Multiple Importance Sampling来减少积分方差。

技术架构

  • 实现了可微分渲染器,基于预测的环境地图、PBR材质和几何表面进行图像渲染。
  • 使用可微分的网格光栅化器和着色器,采用标准的Disney PBR模型。

实现细节

  • 主要损失函数是渲染损失,包括L2距离和感知距离等。
  • 通过编辑点云可以轻松编辑生成的网格。

创新点

  • 通过点云连接两个阶段,确保了快速重建和高质量网格生成。

实验验证

该研究在GSO和OmniObject3D数据集上进行了定量比较,SPAR3D在大多数指标上明显优于其他基线方法。通过定性比较和编辑结果展示了SPAR3D的优势,生成的网格在几何结构和纹理质量上表现出色。

设置

  • 使用Monte Carlo积分和Multiple Importance Sampling。
  • 主要损失函数是渲染损失,包括L2距离和感知距离。

指标

  • 定量比较在GSO和OmniObject3D数据集上进行。
  • 定性比较和编辑结果展示了SPAR3D的优势。

结果

  • SPAR3D在大多数指标上明显优于其他基线方法。
  • 通过消融实验验证了点采样阶段对模型性能的重要性。

比较分析

  • 与其他基线方法在GSO和OmniObject3D数据集上进行了比较。
  • 展示了SPAR3D在3D重建任务中的实用性和性能优势。

影响和意义

该研究的方法提高了单视图3D重建的效率和质量,但仍存在一些局限性,如生成的点云可能存在伪影。未来工作可以通过改进去噪器设计或半监督学习技术来进一步提高SPAR3D的效用和鲁棒性。

主要发现

  • SPAR3D在3D重建任务中取得了显著的性能优势。
  • 通过消融实验验证了点采样阶段对模型性能的重要性。

局限性

  • 生成的点云可能存在小表面尖刺或分离部分的伪影。
  • 材质分解的准确性有时可能不佳。

未来方向

  • 探索半监督学习技术可能有助于更合理地估计材质。
  • 改进去噪器设计或扩散采样器等方法,提高SPAR3D的效用和鲁棒性。

实际意义

  • SPAR3D为单视图3D重建任务提供了实用解决方案。
  • 展示了SPAR3D在不同数据集上的泛化能力和性能优势。

热门论文

1比特LLM时代:所有大型语言模型均为1.58比特。
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu WeiFeb 27, 2024612142

DeepSeek-R1:通过强化学习激励LLMs中的推理能力
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-AI, Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Ruoyu Zhang, Runxin Xu, Qihao Zhu, Shirong Ma, Peiyi Wang, Xiao Bi, Xiaokang Zhang, Xingkai Yu, Yu Wu, Z. F. Wu, Zhibin Gou, Zhihong Shao, Zhuoshu Li, Ziyi Gao, Aixin Liu, Bing Xue, Bingxuan Wang, Bochao Wu, Bei Feng, Chengda Lu, Chenggang Zhao, Chengqi Deng, Chenyu Zhang, Chong Ruan, Damai Dai, Deli Chen, Dongjie Ji, Erhang Li, Fangyun Lin, Fucong Dai, Fuli Luo, Guangbo Hao, Guanting Chen, Guowei Li, H. Zhang, Han Bao, Hanwei Xu, Haocheng Wang, Honghui Ding, Huajian Xin, Huazuo Gao, Hui Qu, Hui Li, Jianzhong Guo, Jiashi Li, Jiawei Wang, Jingchang Chen, Jingyang Yuan, Junjie Qiu, Junlong Li, J. L. Cai, Jiaqi Ni, Jian Liang, Jin Chen, Kai Dong, Kai Hu, Kaige Gao, Kang Guan, Kexin Huang, Kuai Yu, Lean Wang, Lecong Zhang, Liang Zhao, Litong Wang, Liyue Zhang, Lei Xu, Leyi Xia, Mingchuan Zhang, Minghua Zhang, Minghui Tang, Meng Li, Miaojun Wang, Mingming Li, Ning Tian, Panpan Huang, Peng Zhang, Qiancheng Wang, Qinyu Chen, Qiushi Du, Ruiqi Ge, Ruisong Zhang, Ruizhe Pan, Runji Wang, R. J. Chen, R. L. Jin, Ruyi Chen, Shanghao Lu, Shangyan Zhou, Shanhuang Chen, Shengfeng Ye, Shiyu Wang, Shuiping Yu, Shunfeng Zhou, Shuting Pan, S. S. Li, Shuang Zhou, Shaoqing Wu, Shengfeng Ye, Tao Yun, Tian Pei, Tianyu Sun, T. Wang, Wangding Zeng, Wanjia Zhao, Wen Liu, Wenfeng Liang, Wenjun Gao, Wenqin Yu, Wentao Zhang, W. L. Xiao, Wei An, Xiaodong Liu, Xiaohan Wang, Xiaokang Chen, Xiaotao Nie, Xin Cheng, Xin Liu, Xin Xie, Xingchao Liu, Xinyu Yang, Xinyuan Li, Xuecheng Su, Xuheng Lin, X. Q. Li, Xiangyue Jin, Xiaojin Shen, Xiaosha Chen, Xiaowen Sun, Xiaoxiang Wang, Xinnan Song, Xinyi Zhou, Xianzu Wang, Xinxia Shan, Y. K. Li, Y. Q. Wang, Y. X. Wei, Yang Zhang, Yanhong Xu, Yao Li, Yao Zhao, Yaofeng Sun, Yaohui Wang, Yi Yu, Yichao Zhang, Yifan Shi, Yiliang Xiong, Ying He, Yishi Piao, Yisong Wang, Yixuan Tan, Yiyang Ma, Yiyuan Liu, Yongqiang Guo, Yuan Ou, Yuduan Wang, Yue Gong, Yuheng Zou, Yujia He, Yunfan Xiong, Yuxiang Luo, Yuxiang You, Yuxuan Liu, Yuyang Zhou, Y. X. Zhu, Yanhong Xu, Yanping Huang, Yaohui Li, Yi Zheng, Yuchen Zhu, Yunxian Ma, Ying Tang, Yukun Zha, Yuting Yan, Z. Z. Ren, Zehui Ren, Zhangli Sha, Zhe Fu, Zhean Xu, Zhenda Xie, Zhengyan Zhang, Zhewen Hao, Zhicheng Ma, Zhigang Yan, Zhiyu Wu, Zihui Gu, Zijia Zhu, Zijun Liu, Zilin Li, Ziwei Xie, Ziyang Song, Zizheng Pan, Zhen Huang, Zhipeng Xu, Zhongyu Zhang, Zhen ZhangJan 22, 20253685

Qwen2.5 技术报告
Qwen2.5 Technical Report

Qwen, An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu, Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, Huan Lin, Jian Yang, Jianhong Tu, Jianwei Zhang, Jianxin Yang, Jiaxi Yang, Jingren Zhou, Junyang Lin, Kai Dang, Keming Lu, Keqin Bao, Kexin Yang, Le Yu, Mei Li, Mingfeng Xue, Pei Zhang, Qin Zhu, Rui Men, Runji Lin, Tianhao Li, Tingyu Xia, Xingzhang Ren, Xuancheng Ren, Yang Fan, Yang Su, Yichang Zhang, Yu Wan, Yuqiong Liu, Zeyu Cui, Zhenru Zhang, Zihan QiuDec 19, 202436311

PDF175January 9, 2025