PPTAgent: テキストからスライドへの生成と評価を超えたプレゼンテーション
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
January 7, 2025
著者: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI
要旨
文書からプレゼンテーションを自動生成することは、コンテンツの質、視覚デザイン、構造の整合性をバランスよく保つことを要求する難しい課題です。既存の手法は主にコンテンツの質を改善し評価することに焦点を当てており、しばしば視覚デザインや構造の整合性を見落としているため、実用性が制限されています。これらの制限に対処するために、私たちは人間のワークフローに着想を得た2段階の編集ベースのアプローチによって、プレゼンテーション生成を包括的に改善するPPTAgentを提案します。PPTAgentはまず、参照プレゼンテーションを分析してその構造パターンとコンテンツスキーマを理解し、次にアウトラインを起草し、コードアクションを介してスライドを生成して整合性と整列を確保します。生成されたプレゼンテーションの品質を包括的に評価するために、Content、Design、Coherenceの3つの次元でプレゼンテーションを評価する評価フレームワークであるPPTEvalをさらに導入します。実験の結果、PPTAgentは全ての次元で従来の自動プレゼンテーション生成手法を大幅に上回ることが示されました。コードとデータはhttps://github.com/icip-cas/PPTAgent で入手可能です。
English
Automatically generating presentations from documents is a challenging task
that requires balancing content quality, visual design, and structural
coherence. Existing methods primarily focus on improving and evaluating the
content quality in isolation, often overlooking visual design and structural
coherence, which limits their practical applicability. To address these
limitations, we propose PPTAgent, which comprehensively improves presentation
generation through a two-stage, edit-based approach inspired by human
workflows. PPTAgent first analyzes reference presentations to understand their
structural patterns and content schemas, then drafts outlines and generates
slides through code actions to ensure consistency and alignment. To
comprehensively evaluate the quality of generated presentations, we further
introduce PPTEval, an evaluation framework that assesses presentations across
three dimensions: Content, Design, and Coherence. Experiments show that
PPTAgent significantly outperforms traditional automatic presentation
generation methods across all three dimensions. The code and data are available
at https://github.com/icip-cas/PPTAgent.Summary
AI-Generated Summary