オムニシンク:思考を通じた機械執筆における知識境界の拡大
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking
January 16, 2025
著者: Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI
要旨
大規模言語モデルを用いた機械による文章生成は、しばしば検索拡張生成に依存しています。しかしながら、これらの手法はモデルの事前定義された範囲内に閉じ込められており、情報豊かなコンテンツの生成を制限しています。具体的には、バニラ検索された情報は深さや有用性に欠け、冗長性があり、生成された記事の品質に悪影響を与え、浅い、繰り返しの多い、非オリジナルな出力をもたらします。これらの問題に対処するために、私たちはOmniThinkを提案します。これは、反復的な拡張と反映の人間らしいプロセスを模倣した機械文章作成フレームワークです。OmniThinkの核となるアイデアは、学習者がトピックの知識を徐々に深める過程をシミュレートすることです。実験結果は、OmniThinkが一貫性や深さなどの指標を損なうことなく、生成された記事の知識密度を向上させることを示しています。人間の評価と専門家のフィードバックは、OmniThinkが長文記事の生成における現実世界の課題に対処する潜在能力をさらに強調しています。
English
Machine writing with large language models often relies on
retrieval-augmented generation. However, these approaches remain confined
within the boundaries of the model's predefined scope, limiting the generation
of content with rich information. Specifically, vanilla-retrieved information
tends to lack depth, utility, and suffers from redundancy, which negatively
impacts the quality of generated articles, leading to shallow, repetitive, and
unoriginal outputs. To address these issues, we propose OmniThink, a machine
writing framework that emulates the human-like process of iterative expansion
and reflection. The core idea behind OmniThink is to simulate the cognitive
behavior of learners as they progressively deepen their knowledge of the
topics. Experimental results demonstrate that OmniThink improves the knowledge
density of generated articles without compromising metrics such as coherence
and depth. Human evaluations and expert feedback further highlight the
potential of OmniThink to address real-world challenges in the generation of
long-form articles.Summary
AI-Generated Summary