Menschliche Bewegungsverlernung
Human Motion Unlearning
March 24, 2025
Autoren: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI
Zusammenfassung
Wir führen die Aufgabe des Human Motion Unlearning ein, um die Synthese von
toxischen Animationen zu verhindern, während die allgemeine Text-zu-Bewegung-Generierungsleistung
erhalten bleibt. Das Unlearning toxischer Bewegungen ist herausfordernd, da diese sowohl aus
expliziten Textprompts als auch aus implizit toxischen Kombinationen sicherer Bewegungen
erzeugt werden können (z.B. ist „Treten“ eine Kombination aus „Bein laden und schwingen“).
Wir schlagen den ersten Motion-Unlearning-Benchmark vor, indem wir toxische Bewegungen aus den
großen und aktuellen Text-zu-Bewegung-Datensätzen HumanML3D und Motion-X filtern. Wir stellen
Baselines vor, indem wir state-of-the-art Bild-Unlearning-Techniken anpassen, um räumlich-zeitliche
Signale zu verarbeiten. Schließlich präsentieren wir ein neuartiges Motion-Unlearning-Modell
basierend auf Latent Code Replacement, das wir LCR nennen. LCR ist trainingsfrei und eignet sich
für die diskreten latenten Räume von state-of-the-art Text-zu-Bewegung-Diffusionsmodellen. LCR
ist einfach und übertrifft die Baselines sowohl qualitativ als auch quantitativ konsistent.
Projektseite: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of
toxic animations while preserving the general text-to-motion generative
performance. Unlearning toxic motions is challenging as those can be generated
from explicit text prompts and from implicit toxic combinations of safe motions
(e.g., ``kicking" is ``loading and swinging a leg"). We propose the first
motion unlearning benchmark by filtering toxic motions from the large and
recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines,
by adapting state-of-the-art image unlearning techniques to process
spatio-temporal signals. Finally, we propose a novel motion unlearning model
based on Latent Code Replacement, which we dub LCR. LCR is training-free and
suitable to the discrete latent spaces of state-of-the-art text-to-motion
diffusion models. LCR is simple and consistently outperforms baselines
qualitatively and quantitatively. Project page:
https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.Summary
AI-Generated Summary