Watermarking Robusto Utilizzando Precedenti Generativi Contro la Modifica delle Immagini: Dal Benchmarking ai Progressi

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

October 24, 2024
Autori: Shilin Lu, Zihan Zhou, Jiayou Lu, Yuanzhi Zhu, Adams Wai-Kin Kong
cs.AI

Abstract

I metodi attuali di watermarking delle immagini sono vulnerabili alle tecniche avanzate di editing delle immagini abilitate dai modelli di generazione di testo-immagine su larga scala. Questi modelli possono distorto i watermark incorporati durante l'editing, presentando significativi sfide alla protezione del copyright. In questo lavoro, presentiamo W-Bench, il primo benchmark completo progettato per valutare la robustezza dei metodi di watermarking contro una vasta gamma di tecniche di editing delle immagini, inclusa la rigenerazione delle immagini, l'editing globale, l'editing locale e la generazione di immagini-video. Attraverso valutazioni approfondite di undici metodi di watermarking rappresentativi contro le tecniche di editing prevalenti, dimostriamo che la maggior parte dei metodi non riesce a rilevare i watermark dopo tali modifiche. Per affrontare questa limitazione, proponiamo VINE, un metodo di watermarking che migliora significativamente la robustezza contro varie tecniche di editing delle immagini mantenendo un'alta qualità delle immagini. Il nostro approccio prevede due innovazioni chiave: (1) analizziamo le caratteristiche di frequenza dell'editing delle immagini e identifichiamo che le distorsioni sfocate presentano proprietà di frequenza simili, il che ci consente di utilizzarle come attacchi surrogati durante l'addestramento per rafforzare la robustezza del watermark; (2) sfruttiamo un modello di diffusione preaddestrato su larga scala SDXL-Turbo, adattandolo per il compito di watermarking per ottenere un'incorporazione del watermark più impercettibile e robusta. I risultati sperimentali mostrano che il nostro metodo raggiunge un'eccellente performance di watermarking sotto varie tecniche di editing delle immagini, superando i metodi esistenti sia in qualità delle immagini che in robustezza. Il codice è disponibile su https://github.com/Shilin-LU/VINE.
English
Current image watermarking methods are vulnerable to advanced image editing techniques enabled by large-scale text-to-image models. These models can distort embedded watermarks during editing, posing significant challenges to copyright protection. In this work, we introduce W-Bench, the first comprehensive benchmark designed to evaluate the robustness of watermarking methods against a wide range of image editing techniques, including image regeneration, global editing, local editing, and image-to-video generation. Through extensive evaluations of eleven representative watermarking methods against prevalent editing techniques, we demonstrate that most methods fail to detect watermarks after such edits. To address this limitation, we propose VINE, a watermarking method that significantly enhances robustness against various image editing techniques while maintaining high image quality. Our approach involves two key innovations: (1) we analyze the frequency characteristics of image editing and identify that blurring distortions exhibit similar frequency properties, which allows us to use them as surrogate attacks during training to bolster watermark robustness; (2) we leverage a large-scale pretrained diffusion model SDXL-Turbo, adapting it for the watermarking task to achieve more imperceptible and robust watermark embedding. Experimental results show that our method achieves outstanding watermarking performance under various image editing techniques, outperforming existing methods in both image quality and robustness. Code is available at https://github.com/Shilin-LU/VINE.

Summary

AI-Generated Summary

PDF92November 16, 2024