Bildverbesserung: Hochwertige Bildgenerierung mit Pixelraum-Laplace-Diffusionsmodellen
Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models
November 11, 2024
Autoren: NVIDIA, Yuval Atzmon, Maciej Bala, Yogesh Balaji, Tiffany Cai, Yin Cui, Jiaojiao Fan, Yunhao Ge, Siddharth Gururani, Jacob Huffman, Ronald Isaac, Pooya Jannaty, Tero Karras, Grace Lam, J. P. Lewis, Aaron Licata, Yen-Chen Lin, Ming-Yu Liu, Qianli Ma, Arun Mallya, Ashlee Martino-Tarr, Doug Mendez, Seungjun Nah, Chris Pruett, Fitsum Reda, Jiaming Song, Ting-Chun Wang, Fangyin Wei, Xiaohui Zeng, Yu Zeng, Qinsheng Zhang
cs.AI
Zusammenfassung
Wir stellen Edify Image vor, eine Familie von Diffusionsmodellen, die in der Lage sind, fotorealistische Bildinhalte mit pixelgenauer Genauigkeit zu generieren. Edify Image nutzt kaskadierte Pixelraum-Diffusionsmodelle, die mithilfe eines neuartigen Laplace-Diffusionsprozesses trainiert werden, bei dem Bildsignale in verschiedenen Frequenzbändern mit unterschiedlichen Raten abgeschwächt werden. Edify Image unterstützt eine Vielzahl von Anwendungen, darunter Text-zu-Bild-Synthese, 4K-Auflösung, ControlNets, 360 HDR-Panoramaerstellung und Feinabstimmung für die Bildanpassung.
English
We introduce Edify Image, a family of diffusion models capable of generating
photorealistic image content with pixel-perfect accuracy. Edify Image utilizes
cascaded pixel-space diffusion models trained using a novel Laplacian diffusion
process, in which image signals at different frequency bands are attenuated at
varying rates. Edify Image supports a wide range of applications, including
text-to-image synthesis, 4K upsampling, ControlNets, 360 HDR panorama
generation, and finetuning for image customization.Summary
AI-Generated Summary