PPTAgent: Generazione ed Valutazione di Presentazioni Oltre il Testo alle Diapositive
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
January 7, 2025
Autori: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI
Abstract
Generare automaticamente presentazioni da documenti è un compito impegnativo che richiede di bilanciare la qualità del contenuto, il design visivo e la coerenza strutturale. I metodi esistenti si concentrano principalmente sul miglioramento e sulla valutazione della qualità del contenuto in modo isolato, spesso trascurando il design visivo e la coerenza strutturale, il che limita la loro applicabilità pratica. Per affrontare queste limitazioni, proponiamo PPTAgent, che migliora in modo esaustivo la generazione di presentazioni attraverso un approccio in due fasi basato sulla modifica ispirato ai flussi di lavoro umani. PPTAgent analizza innanzitutto presentazioni di riferimento per comprendere i loro schemi strutturali e contenutistici, quindi redige schemi e genera diapositive attraverso azioni di codice per garantire coerenza e allineamento. Per valutare in modo esaustivo la qualità delle presentazioni generate, introduciamo inoltre PPTEval, un framework di valutazione che valuta le presentazioni su tre dimensioni: Contenuto, Design e Coerenza. Gli esperimenti mostrano che PPTAgent supera significativamente i tradizionali metodi di generazione automatica di presentazioni su tutte e tre le dimensioni. Il codice e i dati sono disponibili su https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task
that requires balancing content quality, visual design, and structural
coherence. Existing methods primarily focus on improving and evaluating the
content quality in isolation, often overlooking visual design and structural
coherence, which limits their practical applicability. To address these
limitations, we propose PPTAgent, which comprehensively improves presentation
generation through a two-stage, edit-based approach inspired by human
workflows. PPTAgent first analyzes reference presentations to understand their
structural patterns and content schemas, then drafts outlines and generates
slides through code actions to ensure consistency and alignment. To
comprehensively evaluate the quality of generated presentations, we further
introduce PPTEval, an evaluation framework that assesses presentations across
three dimensions: Content, Design, and Coherence. Experiments show that
PPTAgent significantly outperforms traditional automatic presentation
generation methods across all three dimensions. The code and data are available
at https://github.com/icip-cas/PPTAgent.Summary
AI-Generated Summary