OmniThink: Expandindo os Limites do Conhecimento na Escrita Automática por meio do Pensamento
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking
January 16, 2025
Autores: Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen
A escrita por máquina com grandes modelos de linguagem frequentemente depende da geração aumentada por recuperação. No entanto, essas abordagens permanecem limitadas dentro dos limites do escopo predefinido do modelo, o que restringe a geração de conteúdo com informações ricas. Especificamente, as informações recuperadas de forma convencional tendem a carecer de profundidade, utilidade e sofrem de redundância, o que impacta negativamente a qualidade dos artigos gerados, resultando em saídas superficiais, repetitivas e não originais. Para abordar esses problemas, propomos o OmniThink, um framework de escrita por máquina que emula o processo humano de expansão e reflexão iterativa. A ideia central por trás do OmniThink é simular o comportamento cognitivo dos aprendizes à medida que aprofundam progressivamente seu conhecimento sobre os tópicos. Resultados experimentais demonstram que o OmniThink melhora a densidade de conhecimento dos artigos gerados sem comprometer métricas como coerência e profundidade. Avaliações humanas e feedback de especialistas destacam ainda mais o potencial do OmniThink para lidar com desafios do mundo real na geração de artigos longos.
Machine writing with large language models often relies on
retrieval-augmented generation. However, these approaches remain confined
within the boundaries of the model's predefined scope, limiting the generation
of content with rich information. Specifically, vanilla-retrieved information
tends to lack depth, utility, and suffers from redundancy, which negatively
impacts the quality of generated articles, leading to shallow, repetitive, and
unoriginal outputs. To address these issues, we propose OmniThink, a machine
writing framework that emulates the human-like process of iterative expansion
and reflection. The core idea behind OmniThink is to simulate the cognitive
behavior of learners as they progressively deepen their knowledge of the
topics. Experimental results demonstrate that OmniThink improves the knowledge
density of generated articles without compromising metrics such as coherence
and depth. Human evaluations and expert feedback further highlight the
potential of OmniThink to address real-world challenges in the generation of
long-form articles.Summary
AI-Generated Summary