Framer : Interpolation de Cadre Interactive

Framer: Interactive Frame Interpolation

October 24, 2024
Auteurs: Wen Wang, Qiuyu Wang, Kecheng Zheng, Hao Ouyang, Zhekai Chen, Biao Gong, Hao Chen, Yujun Shen, Chunhua Shen
cs.AI

Résumé

Nous proposons Framer pour l'interpolation interactive de cadres, qui vise à produire des images en transition en douceur entre deux images selon la créativité de l'utilisateur. Concrètement, en plus de prendre les images de départ et d'arrivée en entrée, notre approche permet de personnaliser le processus de transition en adaptant la trajectoire de certains points clés sélectionnés. Un tel design présente deux avantages clairs. Premièrement, l'incorporation de l'interaction humaine atténue le problème découlant des nombreuses possibilités de transformer une image en une autre, et permet ainsi un contrôle plus précis des mouvements locaux. Deuxièmement, en tant que forme la plus basique d'interaction, les points clés aident à établir la correspondance entre les cadres, améliorant le modèle pour gérer des cas complexes (par exemple, des objets sur les images de départ et d'arrivée ont des formes et styles différents). Il est à noter que notre système propose également un mode "autopilote", où nous introduisons un module pour estimer les points clés et affiner automatiquement la trajectoire, afin de simplifier l'utilisation en pratique. Des résultats expérimentaux approfondis démontrent les performances attrayantes de Framer sur diverses applications, telles que la morphing d'images, la génération de vidéos en accéléré, l'interpolation de dessins animés, etc. Le code, le modèle et l'interface seront publiés pour faciliter de futures recherches.
English
We propose Framer for interactive frame interpolation, which targets producing smoothly transitioning frames between two images as per user creativity. Concretely, besides taking the start and end frames as inputs, our approach supports customizing the transition process by tailoring the trajectory of some selected keypoints. Such a design enjoys two clear benefits. First, incorporating human interaction mitigates the issue arising from numerous possibilities of transforming one image to another, and in turn enables finer control of local motions. Second, as the most basic form of interaction, keypoints help establish the correspondence across frames, enhancing the model to handle challenging cases (e.g., objects on the start and end frames are of different shapes and styles). It is noteworthy that our system also offers an "autopilot" mode, where we introduce a module to estimate the keypoints and refine the trajectory automatically, to simplify the usage in practice. Extensive experimental results demonstrate the appealing performance of Framer on various applications, such as image morphing, time-lapse video generation, cartoon interpolation, etc. The code, the model, and the interface will be released to facilitate further research.

Summary

AI-Generated Summary

PDF362November 16, 2024