Nascosto nel Rumore: Watermarking Robusto a Due Fasi per Immagini

Hidden in the Noise: Two-Stage Robust Watermarking for Images

December 5, 2024
Autori: Kasra Arabi, Benjamin Feuer, R. Teal Witter, Chinmay Hegde, Niv Cohen
cs.AI

Abstract

Con il miglioramento della qualità dei generatori di immagini, i deepfake diventano un argomento di considerevole dibattito sociale. Il watermarking delle immagini consente ai proprietari responsabili dei modelli di rilevare e contrassegnare i contenuti generati dall'IA, il che può attenuare il danno. Tuttavia, i metodi attuali allo stato dell'arte nel watermarking delle immagini rimangono vulnerabili agli attacchi di falsificazione e rimozione. Questa vulnerabilità si verifica in parte perché i watermark distortono la distribuzione delle immagini generate, rivelando involontariamente informazioni sulle tecniche di watermarking. In questo lavoro, dimostriamo innanzitutto un metodo di watermarking per immagini privo di distorsioni, basato sul rumore iniziale di un modello di diffusione. Tuttavia, rilevare il watermark richiede il confronto del rumore iniziale ricostruito per un'immagine con tutti i rumori iniziali precedentemente utilizzati. Per attenuare questi problemi, proponiamo un framework di watermarking a due fasi per una rilevazione efficiente. Durante la generazione, aumentiamo il rumore iniziale con modelli di Fourier generati per incorporare informazioni sul gruppo di rumori iniziali che abbiamo utilizzato. Per la rilevazione, (i) recuperiamo il gruppo rilevante di rumori e (ii) cerchiamo all'interno del gruppo dato un rumore iniziale che potrebbe corrispondere alla nostra immagine. Questo approccio di watermarking raggiunge una robustezza allo stato dell'arte contro la falsificazione e la rimozione in una vasta gamma di attacchi.
English
As the quality of image generators continues to improve, deepfakes become a topic of considerable societal debate. Image watermarking allows responsible model owners to detect and label their AI-generated content, which can mitigate the harm. Yet, current state-of-the-art methods in image watermarking remain vulnerable to forgery and removal attacks. This vulnerability occurs in part because watermarks distort the distribution of generated images, unintentionally revealing information about the watermarking techniques. In this work, we first demonstrate a distortion-free watermarking method for images, based on a diffusion model's initial noise. However, detecting the watermark requires comparing the initial noise reconstructed for an image to all previously used initial noises. To mitigate these issues, we propose a two-stage watermarking framework for efficient detection. During generation, we augment the initial noise with generated Fourier patterns to embed information about the group of initial noises we used. For detection, we (i) retrieve the relevant group of noises, and (ii) search within the given group for an initial noise that might match our image. This watermarking approach achieves state-of-the-art robustness to forgery and removal against a large battery of attacks.

Summary

AI-Generated Summary

PDF282December 11, 2024