PPTAgent: Gerando e Avaliando Apresentações Além de Texto para Slides
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
January 7, 2025
Autores: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI
Resumo
Gerar automaticamente apresentações a partir de documentos é uma tarefa desafiadora que requer equilibrar a qualidade do conteúdo, design visual e coerência estrutural. Os métodos existentes geralmente se concentram em melhorar e avaliar a qualidade do conteúdo de forma isolada, muitas vezes negligenciando o design visual e a coerência estrutural, o que limita sua aplicabilidade prática. Para lidar com essas limitações, propomos o PPTAgent, que melhora de forma abrangente a geração de apresentações por meio de uma abordagem em duas etapas baseada em edições, inspirada nos fluxos de trabalho humanos. O PPTAgent analisa primeiro apresentações de referência para entender seus padrões estruturais e esquemas de conteúdo, em seguida, elabora esboços e gera slides por meio de ações de código para garantir consistência e alinhamento. Para avaliar abrangentemente a qualidade das apresentações geradas, introduzimos ainda o PPTEval, um framework de avaliação que avalia apresentações em três dimensões: Conteúdo, Design e Coerência. Experimentos mostram que o PPTAgent supera significativamente os métodos tradicionais de geração automática de apresentações em todas as três dimensões. O código e os dados estão disponíveis em https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task
that requires balancing content quality, visual design, and structural
coherence. Existing methods primarily focus on improving and evaluating the
content quality in isolation, often overlooking visual design and structural
coherence, which limits their practical applicability. To address these
limitations, we propose PPTAgent, which comprehensively improves presentation
generation through a two-stage, edit-based approach inspired by human
workflows. PPTAgent first analyzes reference presentations to understand their
structural patterns and content schemas, then drafts outlines and generates
slides through code actions to ensure consistency and alignment. To
comprehensively evaluate the quality of generated presentations, we further
introduce PPTEval, an evaluation framework that assesses presentations across
three dimensions: Content, Design, and Coherence. Experiments show that
PPTAgent significantly outperforms traditional automatic presentation
generation methods across all three dimensions. The code and data are available
at https://github.com/icip-cas/PPTAgent.Summary
AI-Generated Summary