FireFlow: 이미지 의미 편집을 위한 정류된 흐름의 빠른 역전
FireFlow: Fast Inversion of Rectified Flow for Image Semantic Editing
December 10, 2024
저자: Yingying Deng, Xiangyu He, Changwang Mei, Peisong Wang, Fan Tang
cs.AI
초록
ReFlows(ReFlows)와 증류(distillation)를 활용한 Rectified Flows는 빠른 샘플링을 위한 유망한 방법을 제공하지만, 빠른 역변환은 이미지를 구조화된 잡음으로 변환하여 복구하고 후속 편집은 여전히 해결되지 않은 문제입니다. 본 논문에서는 FireFlow를 소개합니다. 이는 ReFlow 기반 모델(예: FLUX)의 놀라운 생성 능력을 계승하면서 8단계에서 정확한 역변환 및 편집을 확장하는 간단하면서도 효과적인 제로샷 접근법입니다. 우리는 먼저 ReFlow 역변환에 중요한 역할을 하는 신중히 설계된 수치 해법이 ReFlow 역변환에서 두 번째 차원 해법의 정밀성을 유지하면서 첫 번째 차원 Euler 방법의 실용적 효율성을 유지하는 것을 보여줍니다. 이 해법은 최첨단 ReFlow 역변환 및 편집 기술과 비교하여 3배 빠른 실행 속도 향상을 달성하면서, 훈련 없이 더 작은 재구성 오류와 우수한 편집 결과를 제공합니다. 코드는 https://github.com/HolmesShuan/FireFlow{이 URL}에서 확인할 수 있습니다.
English
Though Rectified Flows (ReFlows) with distillation offers a promising way for
fast sampling, its fast inversion transforms images back to structured noise
for recovery and following editing remains unsolved. This paper introduces
FireFlow, a simple yet effective zero-shot approach that inherits the startling
capacity of ReFlow-based models (such as FLUX) in generation while extending
its capabilities to accurate inversion and editing in 8 steps. We first
demonstrate that a carefully designed numerical solver is pivotal for ReFlow
inversion, enabling accurate inversion and reconstruction with the precision of
a second-order solver while maintaining the practical efficiency of a
first-order Euler method. This solver achieves a 3times runtime speedup
compared to state-of-the-art ReFlow inversion and editing techniques, while
delivering smaller reconstruction errors and superior editing results in a
training-free mode. The code is available at
https://github.com/HolmesShuan/FireFlow{this URL}.