個人化的三維生成化身:從單一肖像製作

PERSE: Personalized 3D Generative Avatars from A Single Portrait

December 30, 2024
作者: Hyunsoo Cha, Inhee Lee, Hanbyul Joo
cs.AI

摘要

我們提出了一種名為PERSE的方法,用於從參考肖像建立一個可動畫且個性化的生成頭像。我們的頭像模型能夠在連續且解耦的潛在空間中進行面部屬性編輯,以控制每個面部屬性,同時保留個人的身份特徵。為了實現這一目標,我們的方法首先通過合成大規模的2D合成視頻數據集來開始,其中每個視頻包含面部表情和視角的一致變化,結合原始輸入中特定面部屬性的變化。我們提出了一種新的流程,用於生成具有面部屬性編輯的高質量、照片逼真的2D視頻。利用這個合成屬性數據集,我們提出了一種基於3D高斯散點的個性化頭像創建方法,學習一個連續且解耦的潛在空間,用於直觀地進行面部屬性操作。為了在這個潛在空間中實現平滑過渡,我們引入了一種潛在空間正則化技術,通過使用插值的2D面部作為監督。與先前的方法相比,我們展示了PERSE生成具有插值屬性的高質量頭像,同時保留了參考人物的身份特徵。
English
We present PERSE, a method for building an animatable personalized generative avatar from a reference portrait. Our avatar model enables facial attribute editing in a continuous and disentangled latent space to control each facial attribute, while preserving the individual's identity. To achieve this, our method begins by synthesizing large-scale synthetic 2D video datasets, where each video contains consistent changes in the facial expression and viewpoint, combined with a variation in a specific facial attribute from the original input. We propose a novel pipeline to produce high-quality, photorealistic 2D videos with facial attribute editing. Leveraging this synthetic attribute dataset, we present a personalized avatar creation method based on the 3D Gaussian Splatting, learning a continuous and disentangled latent space for intuitive facial attribute manipulation. To enforce smooth transitions in this latent space, we introduce a latent space regularization technique by using interpolated 2D faces as supervision. Compared to previous approaches, we demonstrate that PERSE generates high-quality avatars with interpolated attributes while preserving identity of reference person.

Summary

AI-Generated Summary

論文概述

本文介紹了一種名為PERSE的方法,可從單張參考肖像照片生成個性化的化身,具有對面部特徵進行編輯的能力。通過合成大規模的2D視頻數據集,結合面部表情和觀點的變化,提出了生成高質量2D視頻的管道,並引入潛在空間正則化技術。該方法展示了高質量化身生成,同時保留參考人的身份。

核心貢獻

  1. 提出生成個性化3D化身方法。
  2. 開發生成高質量2D視頻數據集方法。
  3. 引入潛在空間正則化技術。
  4. 使用Low-Rank Adaptation (LoRA)進行有效微調。

研究背景

這項研究背景在於從單張肖像圖像生成個性化生成頭像,實現面部屬性編輯並保留個體身份。該研究填補了現有文獻中對於這一特定領域的缺口,並解決了技術挑戰。

研究缺口

  1. 缺乏從單張肖像圖像生成個性化生成頭像的方法。
  2. 面部屬性編輯需要持續且分離。
  3. 現有方法在保留身份的同時進行面部屬性轉移的效果有限。

技術挑戰

  1. 實現高質量2D視頻數據集的合成。
  2. 有效整合新的面部特徵到化身模型中。
  3. 應對未見或插值的屬性外觀。
  4. 實現插值樣本的渲染質量和真實感。

方法論

本文方法論基於生成高質量2D視頻數據集,包括生成屬性編輯圖像和動畫化編輯的肖像圖像。使用潛在空間正則化技術處理未見或插值的屬性外觀,並通過LoRA進行有效的微調技術。

理論基礎

  1. 基於3D高斯Splatting創建個性化化身。
  2. 引入潛在空間正則化技術。
  3. 使用Low-Rank Adaptation (LoRA)進行微調。

技術架構

  1. 生成高質量2D視頻數據集的管道。
  2. 基於PEGASUS模型構建個性化生成化身模型。
  3. 引入CLIP指導的潛在空間配置。

實施細節

  1. 使用DiffMorpher生成插值圖像進行微調。
  2. 訓練主題特定的LoRA。
  3. 使用FLUX進行圖像修復和SDXL生成屬性遮罩。

創新點

  1. 提出LoRA技術整合新的面部特徵。
  2. 引入潛在空間正則化技術處理未見或插值的屬性外觀。
  3. 通過插值損失改善插值樣本的渲染質量和真實感。

實驗驗證

本文進行了實驗驗證,包括設置、評估指標、結果和與基線方法的比較。

設置

  1. 生成合成肖像視頻數據集。
  2. 訓練模型重建3D頭像。
  3. 進行面部屬性轉移的研究。

評估指標

  1. FID和KID分數。
  2. 插值樣本的渲染質量。
  3. 與其他基線方法的比較。

結果

  1. 成功實現高質量合成屬性視頻數據集生成。
  2. 有效整合新的面部特徵到頭像模型中。
  3. 在合成數據集上取得優越性能。

比較分析

  1. 與PEGASUS、Conditional INSTA和Conditional SplattingAvatar進行比較。
  2. 通過FID和KID分數進行評估。
  3. 進行用戶研究評估插值樣本的渲染質量。

影響與啟示

本文方法的影響和啟示包括闡述關鍵發現、限制、未來方向和實際意義。

關鍵發現

  1. 成功實現從單張肖像圖像生成可動畫的個性化生成頭像。
  2. 提出潛在空間正則化技術處理未見或插值的屬性外觀。
  3. 在合成數據集中重建樞軸時保留身份的準確性。

限制

  1. 需要進一步改進插值樣本的渲染質量。
  2. 面部屬性轉移的效果仍有提升空間。

未來方向

  1. 探索更多面部特徵的整合方法。
  2. 進一步優化潛在空間正則化技術。

實際意義

  1. 可應用於影視特效和遊戲開發領域。
  2. 有助於提升人臉識別和合成技術的水平。

熱門論文

1比特LLM時代:所有大型語言模型都在1.58比特。
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu WeiFeb 27, 2024612142

DeepSeek-R1:通過強化學習激勵LLM中的推理能力
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-AI, Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Ruoyu Zhang, Runxin Xu, Qihao Zhu, Shirong Ma, Peiyi Wang, Xiao Bi, Xiaokang Zhang, Xingkai Yu, Yu Wu, Z. F. Wu, Zhibin Gou, Zhihong Shao, Zhuoshu Li, Ziyi Gao, Aixin Liu, Bing Xue, Bingxuan Wang, Bochao Wu, Bei Feng, Chengda Lu, Chenggang Zhao, Chengqi Deng, Chenyu Zhang, Chong Ruan, Damai Dai, Deli Chen, Dongjie Ji, Erhang Li, Fangyun Lin, Fucong Dai, Fuli Luo, Guangbo Hao, Guanting Chen, Guowei Li, H. Zhang, Han Bao, Hanwei Xu, Haocheng Wang, Honghui Ding, Huajian Xin, Huazuo Gao, Hui Qu, Hui Li, Jianzhong Guo, Jiashi Li, Jiawei Wang, Jingchang Chen, Jingyang Yuan, Junjie Qiu, Junlong Li, J. L. Cai, Jiaqi Ni, Jian Liang, Jin Chen, Kai Dong, Kai Hu, Kaige Gao, Kang Guan, Kexin Huang, Kuai Yu, Lean Wang, Lecong Zhang, Liang Zhao, Litong Wang, Liyue Zhang, Lei Xu, Leyi Xia, Mingchuan Zhang, Minghua Zhang, Minghui Tang, Meng Li, Miaojun Wang, Mingming Li, Ning Tian, Panpan Huang, Peng Zhang, Qiancheng Wang, Qinyu Chen, Qiushi Du, Ruiqi Ge, Ruisong Zhang, Ruizhe Pan, Runji Wang, R. J. Chen, R. L. Jin, Ruyi Chen, Shanghao Lu, Shangyan Zhou, Shanhuang Chen, Shengfeng Ye, Shiyu Wang, Shuiping Yu, Shunfeng Zhou, Shuting Pan, S. S. Li, Shuang Zhou, Shaoqing Wu, Shengfeng Ye, Tao Yun, Tian Pei, Tianyu Sun, T. Wang, Wangding Zeng, Wanjia Zhao, Wen Liu, Wenfeng Liang, Wenjun Gao, Wenqin Yu, Wentao Zhang, W. L. Xiao, Wei An, Xiaodong Liu, Xiaohan Wang, Xiaokang Chen, Xiaotao Nie, Xin Cheng, Xin Liu, Xin Xie, Xingchao Liu, Xinyu Yang, Xinyuan Li, Xuecheng Su, Xuheng Lin, X. Q. Li, Xiangyue Jin, Xiaojin Shen, Xiaosha Chen, Xiaowen Sun, Xiaoxiang Wang, Xinnan Song, Xinyi Zhou, Xianzu Wang, Xinxia Shan, Y. K. Li, Y. Q. Wang, Y. X. Wei, Yang Zhang, Yanhong Xu, Yao Li, Yao Zhao, Yaofeng Sun, Yaohui Wang, Yi Yu, Yichao Zhang, Yifan Shi, Yiliang Xiong, Ying He, Yishi Piao, Yisong Wang, Yixuan Tan, Yiyang Ma, Yiyuan Liu, Yongqiang Guo, Yuan Ou, Yuduan Wang, Yue Gong, Yuheng Zou, Yujia He, Yunfan Xiong, Yuxiang Luo, Yuxiang You, Yuxuan Liu, Yuyang Zhou, Y. X. Zhu, Yanhong Xu, Yanping Huang, Yaohui Li, Yi Zheng, Yuchen Zhu, Yunxian Ma, Ying Tang, Yukun Zha, Yuting Yan, Z. Z. Ren, Zehui Ren, Zhangli Sha, Zhe Fu, Zhean Xu, Zhenda Xie, Zhengyan Zhang, Zhewen Hao, Zhicheng Ma, Zhigang Yan, Zhiyu Wu, Zihui Gu, Zijia Zhu, Zijun Liu, Zilin Li, Ziwei Xie, Ziyang Song, Zizheng Pan, Zhen Huang, Zhipeng Xu, Zhongyu Zhang, Zhen ZhangJan 22, 20253685

Qwen2.5 技術報告
Qwen2.5 Technical Report

Qwen, An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu, Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, Huan Lin, Jian Yang, Jianhong Tu, Jianwei Zhang, Jianxin Yang, Jiaxi Yang, Jingren Zhou, Junyang Lin, Kai Dang, Keming Lu, Keqin Bao, Kexin Yang, Le Yu, Mei Li, Mingfeng Xue, Pei Zhang, Qin Zhu, Rui Men, Runji Lin, Tianhao Li, Tingyu Xia, Xingzhang Ren, Xuancheng Ren, Yang Fan, Yang Su, Yichang Zhang, Yu Wan, Yuqiong Liu, Zeyu Cui, Zhenru Zhang, Zihan QiuDec 19, 202436311

PDF193December 31, 2024