ChatPaper.aiChatPaper

Sfruttare l'Economia del Ragionamento: Una Rassegna sul Ragionamento Efficiente per i Modelli Linguistici di Grandi Dimensioni

Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

March 31, 2025
Autori: Rui Wang, Hongru Wang, Boyang Xue, Jianhui Pang, Shudong Liu, Yi Chen, Jiahao Qiu, Derek Fai Wong, Heng Ji, Kam-Fai Wong
cs.AI

Abstract

I recenti progressi nei Modelli Linguistici di Grande Dimensione (LLM) hanno notevolmente migliorato la loro capacità di eseguire compiti di ragionamento complesso, passando da un pensiero rapido e intuitivo (Sistema 1) a un ragionamento lento e profondo (Sistema 2). Sebbene il ragionamento del Sistema 2 migliori l'accuratezza dei compiti, spesso comporta costi computazionali significativi a causa della sua natura di pensiero lento e di comportamenti di ragionamento inefficienti o non necessari. Al contrario, il ragionamento del Sistema 1 è computazionalmente efficiente, ma porta a prestazioni subottimali. Di conseguenza, è fondamentale bilanciare il compromesso tra prestazioni (benefici) e costi computazionali (budget), dando vita al concetto di economia del ragionamento. In questa rassegna, forniamo un'analisi completa dell'economia del ragionamento sia nelle fasi di post-addestramento che di inferenza in tempo reale degli LLM, comprendendo i) la causa dell'inefficienza del ragionamento, ii) l'analisi del comportamento dei diversi modelli di ragionamento e iii) le potenziali soluzioni per raggiungere l'economia del ragionamento. Offrendo intuizioni pratiche e evidenziando le sfide aperte, miriamo a far luce sulle strategie per migliorare l'economia del ragionamento degli LLM, servendo così come una risorsa preziosa per avanzare la ricerca in questo settore in evoluzione. Forniamo inoltre un repository pubblico per monitorare continuamente gli sviluppi in questo campo in rapida evoluzione.
English
Recent advancements in Large Language Models (LLMs) have significantly enhanced their ability to perform complex reasoning tasks, transitioning from fast and intuitive thinking (System 1) to slow and deep reasoning (System 2). While System 2 reasoning improves task accuracy, it often incurs substantial computational costs due to its slow thinking nature and inefficient or unnecessary reasoning behaviors. In contrast, System 1 reasoning is computationally efficient but leads to suboptimal performance. Consequently, it is critical to balance the trade-off between performance (benefits) and computational costs (budgets), giving rise to the concept of reasoning economy. In this survey, we provide a comprehensive analysis of reasoning economy in both the post-training and test-time inference stages of LLMs, encompassing i) the cause of reasoning inefficiency, ii) behavior analysis of different reasoning patterns, and iii) potential solutions to achieve reasoning economy. By offering actionable insights and highlighting open challenges, we aim to shed light on strategies for improving the reasoning economy of LLMs, thereby serving as a valuable resource for advancing research in this evolving area. We also provide a public repository to continually track developments in this fast-evolving field.

Summary

AI-Generated Summary

PDF172April 2, 2025