Oltre agli Esempi: Paradigma di Ragionamento Automatico di Alto Livello nell'Apprendimento In-Contesto tramite MCTS
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
November 27, 2024
Autori: Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
cs.AI
Abstract
L'apprendimento in contesto (ICL) consente ai grandi modelli linguistici (LLM) di affrontare compiti successivi attraverso prompt sofisticati e dimostrazioni di alta qualità. Tuttavia, questo paradigma tradizionale di ICL mostra limitazioni quando si confronta con compiti di ragionamento matematico complessi, principalmente a causa della sua forte dipendenza dalla qualità degli esempi e dalla necessità di intervento umano in scenari impegnativi. Per affrontare queste limitazioni, questo articolo presenta HiAR-ICL, un paradigma di Ragionamento Automatizzato ad Alto Livello in ICL che sposta il focus da esempi specifici a modelli di pensiero astratto, estendendo il concetto convenzionale di contesto in ICL. HiAR-ICL introduce cinque azioni di ragionamento atomiche come componenti fondamentali per la costruzione di modelli a catena. Utilizzando la Ricerca ad Albero Monte Carlo, esploriamo percorsi di ragionamento e costruiamo schede di pensiero per guidare inferenze successive. Successivamente sviluppiamo un framework di complessità cognitiva che abbina dinamicamente i problemi con le schede di pensiero appropriate. I risultati sperimentali dimostrano l'efficacia di HiAR-ICL, raggiungendo un'accuratezza all'avanguardia (79,6%) sul benchmark MATH con Qwen2.5-7B-Instruct, superando GPT-4o (76,6%) e Claude 3.5 (71,1%).
English
In-context Learning (ICL) enables large language models (LLMs) to tackle
downstream tasks through sophisticated prompting and high-quality
demonstrations. However, this traditional ICL paradigm shows limitations when
facing complex mathematical reasoning tasks, primarily due to its heavy
dependence on example quality and the necessity for human intervention in
challenging scenarios. To address these limitations, this paper presents
HiAR-ICL, a High-level Automated Reasoning paradigm
in ICL that shifts focus from specific examples to abstract thinking
patterns, extending the conventional concept of context in ICL. HiAR-ICL
introduces five atomic reasoning actions as fundamental components for
constructing chain-structured patterns. Using Monte Carlo Tree Search, we
explore reasoning paths and construct thought cards to guide subsequent
inference. We then develop a cognitive complexity framework that dynamically
matches problems with appropriate thought cards. Experimental results
demonstrate HiAR-ICL's effectiveness, achieving state-of-the-art accuracy
(79.6%) on the MATH benchmark with Qwen2.5-7B-Instruct, surpassing GPT-4o
(76.6%) and Claude 3.5 (71.1%).Summary
AI-Generated Summary