ChatPaper.aiChatPaper

RectifiedHR: Обеспечение эффективного генерации изображений высокого разрешения через энергетическую коррекцию

RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification

March 4, 2025
Авторы: Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen
cs.AI

Аннотация

Диффузионные модели достигли значительных успехов в различных задачах генерации изображений. Однако их производительность заметно снижается при создании изображений с разрешением, превышающим то, что использовалось в период обучения. Несмотря на существование множества методов для получения изображений высокого разрешения, они либо страдают от неэффективности, либо ограничены сложными операциями. В данной статье мы предлагаем RectifiedHR — эффективное и простое решение для генерации изображений высокого разрешения без необходимости дополнительного обучения. В частности, мы представляем стратегию обновления шума, которая теоретически требует всего несколько строк кода для раскрытия способности модели генерировать изображения высокого разрешения и повышения эффективности. Кроме того, мы впервые наблюдаем явление затухания энергии, которое может вызывать размытость изображений в процессе генерации высокого разрешения. Для решения этой проблемы мы предлагаем стратегию коррекции энергии, где модификация гиперпараметров классификатора без учителя эффективно улучшает качество генерации. Наш метод полностью не требует дополнительного обучения и отличается простой логикой реализации. Благодаря обширным сравнениям с множеством базовых методов, наш RectifiedHR демонстрирует превосходную эффективность и производительность.
English
Diffusion models have achieved remarkable advances in various image generation tasks. However, their performance notably declines when generating images at resolutions higher than those used during the training period. Despite the existence of numerous methods for producing high-resolution images, they either suffer from inefficiency or are hindered by complex operations. In this paper, we propose RectifiedHR, an efficient and straightforward solution for training-free high-resolution image generation. Specifically, we introduce the noise refresh strategy, which theoretically only requires a few lines of code to unlock the model's high-resolution generation ability and improve efficiency. Additionally, we first observe the phenomenon of energy decay that may cause image blurriness during the high-resolution image generation process. To address this issue, we propose an Energy Rectification strategy, where modifying the hyperparameters of the classifier-free guidance effectively improves the generation performance. Our method is entirely training-free and boasts a simple implementation logic. Through extensive comparisons with numerous baseline methods, our RectifiedHR demonstrates superior effectiveness and efficiency.

Summary

AI-Generated Summary

PDF103March 5, 2025