OmniThink: Expandindo os Limites do Conhecimento na Escrita Automática por meio do Pensamento

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

January 16, 2025
Autores: Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI

Resumo

A escrita por máquina com grandes modelos de linguagem frequentemente depende da geração aumentada por recuperação. No entanto, essas abordagens permanecem limitadas dentro dos limites do escopo predefinido do modelo, o que restringe a geração de conteúdo com informações ricas. Especificamente, as informações recuperadas de forma convencional tendem a carecer de profundidade, utilidade e sofrem de redundância, o que impacta negativamente a qualidade dos artigos gerados, resultando em saídas superficiais, repetitivas e não originais. Para abordar esses problemas, propomos o OmniThink, um framework de escrita por máquina que emula o processo humano de expansão e reflexão iterativa. A ideia central por trás do OmniThink é simular o comportamento cognitivo dos aprendizes à medida que aprofundam progressivamente seu conhecimento sobre os tópicos. Resultados experimentais demonstram que o OmniThink melhora a densidade de conhecimento dos artigos gerados sem comprometer métricas como coerência e profundidade. Avaliações humanas e feedback de especialistas destacam ainda mais o potencial do OmniThink para lidar com desafios do mundo real na geração de artigos longos.
English
Machine writing with large language models often relies on retrieval-augmented generation. However, these approaches remain confined within the boundaries of the model's predefined scope, limiting the generation of content with rich information. Specifically, vanilla-retrieved information tends to lack depth, utility, and suffers from redundancy, which negatively impacts the quality of generated articles, leading to shallow, repetitive, and unoriginal outputs. To address these issues, we propose OmniThink, a machine writing framework that emulates the human-like process of iterative expansion and reflection. The core idea behind OmniThink is to simulate the cognitive behavior of learners as they progressively deepen their knowledge of the topics. Experimental results demonstrate that OmniThink improves the knowledge density of generated articles without compromising metrics such as coherence and depth. Human evaluations and expert feedback further highlight the potential of OmniThink to address real-world challenges in the generation of long-form articles.

Summary

AI-Generated Summary

PDF302January 17, 2025