オムニシンク:思考を通じた機械執筆における知識境界の拡大

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

January 16, 2025
著者: Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI

要旨

大規模言語モデルを用いた機械による文章生成は、しばしば検索拡張生成に依存しています。しかしながら、これらの手法はモデルの事前定義された範囲内に閉じ込められており、情報豊かなコンテンツの生成を制限しています。具体的には、バニラ検索された情報は深さや有用性に欠け、冗長性があり、生成された記事の品質に悪影響を与え、浅い、繰り返しの多い、非オリジナルな出力をもたらします。これらの問題に対処するために、私たちはOmniThinkを提案します。これは、反復的な拡張と反映の人間らしいプロセスを模倣した機械文章作成フレームワークです。OmniThinkの核となるアイデアは、学習者がトピックの知識を徐々に深める過程をシミュレートすることです。実験結果は、OmniThinkが一貫性や深さなどの指標を損なうことなく、生成された記事の知識密度を向上させることを示しています。人間の評価と専門家のフィードバックは、OmniThinkが長文記事の生成における現実世界の課題に対処する潜在能力をさらに強調しています。
English
Machine writing with large language models often relies on retrieval-augmented generation. However, these approaches remain confined within the boundaries of the model's predefined scope, limiting the generation of content with rich information. Specifically, vanilla-retrieved information tends to lack depth, utility, and suffers from redundancy, which negatively impacts the quality of generated articles, leading to shallow, repetitive, and unoriginal outputs. To address these issues, we propose OmniThink, a machine writing framework that emulates the human-like process of iterative expansion and reflection. The core idea behind OmniThink is to simulate the cognitive behavior of learners as they progressively deepen their knowledge of the topics. Experimental results demonstrate that OmniThink improves the knowledge density of generated articles without compromising metrics such as coherence and depth. Human evaluations and expert feedback further highlight the potential of OmniThink to address real-world challenges in the generation of long-form articles.

Summary

AI-Generated Summary

PDF292January 17, 2025