MCTS-RAG: Potenziamento della Generazione Aumentata dal Recupero con Ricerca ad Albero Monte Carlo
MCTS-RAG: Enhancing Retrieval-Augmented Generation with Monte Carlo Tree Search
March 26, 2025
Autori: Yunhai Hu, Yilun Zhao, Chen Zhao, Arman Cohan
cs.AI
Abstract
Introduciamo MCTS-RAG, un approccio innovativo che potenzia le capacità di ragionamento dei modelli linguistici di piccole dimensioni su compiti ad alta intensità di conoscenza, sfruttando la generazione aumentata da recupero (RAG) per fornire contesto rilevante e la ricerca ad albero Monte Carlo (MCTS) per affinare i percorsi di ragionamento. MCTS-RAG integra dinamicamente il recupero e il ragionamento attraverso un processo decisionale iterativo. A differenza dei metodi RAG standard, che tipicamente recuperano informazioni indipendentemente dal ragionamento e quindi integrano la conoscenza in modo subottimale, o del ragionamento MCTS convenzionale, che dipende esclusivamente dalla conoscenza interna del modello senza fatti esterni, MCTS-RAG combina il ragionamento strutturato con il recupero adattivo. Questo approccio integrato migliora il processo decisionale, riduce le allucinazioni e garantisce una maggiore accuratezza fattuale e coerenza delle risposte. I risultati sperimentali su più dataset di ragionamento e ad alta intensità di conoscenza (ad esempio, ComplexWebQA, GPQA e FoolMeTwice) dimostrano che il nostro metodo consente ai modelli linguistici di piccole dimensioni di raggiungere prestazioni paragonabili a quelle dei modelli linguistici all'avanguardia come GPT-4, scalando efficacemente il calcolo al momento dell'inferenza e stabilendo un nuovo standard per il ragionamento nei modelli di piccole dimensioni.
English
We introduce MCTS-RAG, a novel approach that enhances the reasoning
capabilities of small language models on knowledge-intensive tasks by
leveraging retrieval-augmented generation (RAG) to provide relevant context and
Monte Carlo Tree Search (MCTS) to refine reasoning paths. MCTS-RAG dynamically
integrates retrieval and reasoning through an iterative decision-making
process. Unlike standard RAG methods, which typically retrieve information
independently from reasoning and thus integrate knowledge suboptimally, or
conventional MCTS reasoning, which depends solely on internal model knowledge
without external facts, MCTS-RAG combines structured reasoning with adaptive
retrieval. This integrated approach enhances decision-making, reduces
hallucinations, and ensures improved factual accuracy and response consistency.
The experimental results on multiple reasoning and knowledge-intensive datasets
datasets (i.e., ComplexWebQA, GPQA, and FoolMeTwice) show that our method
enables small-scale LMs to achieve performance comparable to frontier LLMs like
GPT-4o by effectively scaling inference-time compute, setting a new standard
for reasoning in small-scale models.Summary
AI-Generated Summary