PPTAgent: Generazione ed Valutazione di Presentazioni Oltre il Testo alle Diapositive

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

January 7, 2025
Autori: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI

Abstract

Generare automaticamente presentazioni da documenti è un compito impegnativo che richiede di bilanciare la qualità del contenuto, il design visivo e la coerenza strutturale. I metodi esistenti si concentrano principalmente sul miglioramento e sulla valutazione della qualità del contenuto in modo isolato, spesso trascurando il design visivo e la coerenza strutturale, il che limita la loro applicabilità pratica. Per affrontare queste limitazioni, proponiamo PPTAgent, che migliora in modo esaustivo la generazione di presentazioni attraverso un approccio in due fasi basato sulla modifica ispirato ai flussi di lavoro umani. PPTAgent analizza innanzitutto presentazioni di riferimento per comprendere i loro schemi strutturali e contenutistici, quindi redige schemi e genera diapositive attraverso azioni di codice per garantire coerenza e allineamento. Per valutare in modo esaustivo la qualità delle presentazioni generate, introduciamo inoltre PPTEval, un framework di valutazione che valuta le presentazioni su tre dimensioni: Contenuto, Design e Coerenza. Gli esperimenti mostrano che PPTAgent supera significativamente i tradizionali metodi di generazione automatica di presentazioni su tutte e tre le dimensioni. Il codice e i dati sono disponibili su https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.

Summary

AI-Generated Summary

PDF183January 8, 2025