STMA : Un Agent à Mémoire Spatio-Temporelle pour la Planification de Tâches Embarquées à Long Terme
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning
February 14, 2025
Auteurs: Mingcong Lei, Yiming Zhao, Ge Wang, Zhixin Mai, Shuguang Cui, Yatong Han, Jinke Ren
cs.AI
Résumé
Un objectif clé de l'intelligence incarnée est de permettre aux agents d'exécuter des tâches à long terme dans des environnements dynamiques tout en maintenant une prise de décision robuste et une capacité d'adaptation. Pour atteindre cet objectif, nous proposons l'Agent à Mémoire Spatio-Temporelle (STMA), un cadre novateur conçu pour améliorer la planification et l'exécution des tâches grâce à l'intégration d'une mémoire spatio-temporelle. STMA repose sur trois composants essentiels : (1) un module de mémoire spatio-temporelle qui capture en temps réel les changements historiques et environnementaux, (2) un graphe de connaissances dynamique qui facilite le raisonnement spatial adaptatif, et (3) un mécanisme planificateur-critique qui affine itérativement les stratégies de tâches. Nous évaluons STMA dans l'environnement TextWorld sur 32 tâches, impliquant une planification et une exploration en plusieurs étapes avec différents niveaux de complexité. Les résultats expérimentaux montrent que STMA obtient une amélioration de 31,25 % du taux de réussite et une augmentation de 24,7 % du score moyen par rapport au modèle de pointe. Ces résultats soulignent l'efficacité de la mémoire spatio-temporelle pour faire progresser les capacités mémorielles des agents incarnés.
English
A key objective of embodied intelligence is enabling agents to perform
long-horizon tasks in dynamic environments while maintaining robust
decision-making and adaptability. To achieve this goal, we propose the
Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task
planning and execution by integrating spatio-temporal memory. STMA is built
upon three critical components: (1) a spatio-temporal memory module that
captures historical and environmental changes in real time, (2) a dynamic
knowledge graph that facilitates adaptive spatial reasoning, and (3) a
planner-critic mechanism that iteratively refines task strategies. We evaluate
STMA in the TextWorld environment on 32 tasks, involving multi-step planning
and exploration under varying levels of complexity. Experimental results
demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7%
increase in average score compared to the state-of-the-art model. The results
highlight the effectiveness of spatio-temporal memory in advancing the memory
capabilities of embodied agents.Summary
AI-Generated Summary