Beeldverbetering: Hoogwaardige beeldgeneratie met Pixelruimte Laplacian Diffusiemodellen

Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

November 11, 2024
Auteurs: NVIDIA, Yuval Atzmon, Maciej Bala, Yogesh Balaji, Tiffany Cai, Yin Cui, Jiaojiao Fan, Yunhao Ge, Siddharth Gururani, Jacob Huffman, Ronald Isaac, Pooya Jannaty, Tero Karras, Grace Lam, J. P. Lewis, Aaron Licata, Yen-Chen Lin, Ming-Yu Liu, Qianli Ma, Arun Mallya, Ashlee Martino-Tarr, Doug Mendez, Seungjun Nah, Chris Pruett, Fitsum Reda, Jiaming Song, Ting-Chun Wang, Fangyin Wei, Xiaohui Zeng, Yu Zeng, Qinsheng Zhang
cs.AI

Samenvatting

We introduceren Edify Image, een familie van diffusiemodellen die in staat zijn om fotorealistische beeldinhoud met pixel-perfecte nauwkeurigheid te genereren. Edify Image maakt gebruik van opeenvolgende diffusiemodellen in pixelruimte die zijn getraind met behulp van een nieuw Laplacian diffusieproces, waarbij beeldsignalen op verschillende frequentiebanden met variërende snelheden worden verzwakt. Edify Image ondersteunt een breed scala aan toepassingen, waaronder tekst-naar-beeld synthese, 4K upscaling, ControlNets, 360 HDR panorama generatie en finetuning voor beeldaanpassing.
English
We introduce Edify Image, a family of diffusion models capable of generating photorealistic image content with pixel-perfect accuracy. Edify Image utilizes cascaded pixel-space diffusion models trained using a novel Laplacian diffusion process, in which image signals at different frequency bands are attenuated at varying rates. Edify Image supports a wide range of applications, including text-to-image synthesis, 4K upsampling, ControlNets, 360 HDR panorama generation, and finetuning for image customization.

Summary

AI-Generated Summary

PDF285November 12, 2024