ChatPaper.aiChatPaper

Menschliche Bewegungsverlernung

Human Motion Unlearning

March 24, 2025
Autoren: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI

Zusammenfassung

Wir führen die Aufgabe des Human Motion Unlearning ein, um die Synthese von toxischen Animationen zu verhindern, während die allgemeine Text-zu-Bewegung-Generierungsleistung erhalten bleibt. Das Unlearning toxischer Bewegungen ist herausfordernd, da diese sowohl aus expliziten Textprompts als auch aus implizit toxischen Kombinationen sicherer Bewegungen erzeugt werden können (z.B. ist „Treten“ eine Kombination aus „Bein laden und schwingen“). Wir schlagen den ersten Motion-Unlearning-Benchmark vor, indem wir toxische Bewegungen aus den großen und aktuellen Text-zu-Bewegung-Datensätzen HumanML3D und Motion-X filtern. Wir stellen Baselines vor, indem wir state-of-the-art Bild-Unlearning-Techniken anpassen, um räumlich-zeitliche Signale zu verarbeiten. Schließlich präsentieren wir ein neuartiges Motion-Unlearning-Modell basierend auf Latent Code Replacement, das wir LCR nennen. LCR ist trainingsfrei und eignet sich für die diskreten latenten Räume von state-of-the-art Text-zu-Bewegung-Diffusionsmodellen. LCR ist einfach und übertrifft die Baselines sowohl qualitativ als auch quantitativ konsistent. Projektseite: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of toxic animations while preserving the general text-to-motion generative performance. Unlearning toxic motions is challenging as those can be generated from explicit text prompts and from implicit toxic combinations of safe motions (e.g., ``kicking" is ``loading and swinging a leg"). We propose the first motion unlearning benchmark by filtering toxic motions from the large and recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines, by adapting state-of-the-art image unlearning techniques to process spatio-temporal signals. Finally, we propose a novel motion unlearning model based on Latent Code Replacement, which we dub LCR. LCR is training-free and suitable to the discrete latent spaces of state-of-the-art text-to-motion diffusion models. LCR is simple and consistently outperforms baselines qualitatively and quantitatively. Project page: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.

Summary

AI-Generated Summary

PDF12March 25, 2025