ChatPaper.aiChatPaper

ReFeed: Affinamento della Sintesi Multidimensionale con Ragionamento Riflessivo sul Feedback

ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback

March 27, 2025
Autori: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI

Abstract

Il perfezionamento della sintesi incontra sfide quando si estende a più dimensioni. In questo articolo, introduciamo ReFeed, una potente pipeline di perfezionamento della sintesi che migliora più dimensioni attraverso un ragionamento riflessivo sul feedback. Per raggiungere questo obiettivo, rilasciamo SumFeed-CoT, un dataset su larga scala basato su Long-CoT ottimizzato per addestrare un modello leggero con ragionamento riflessivo. I nostri esperimenti rivelano come il numero di dimensioni, l'esposizione al feedback e la politica di ragionamento influenzino le prestazioni di perfezionamento, evidenziando che il ragionamento riflessivo e l'attenzione simultanea a più feedback sono cruciali per mitigare i compromessi tra le dimensioni. Inoltre, ReFeed è robusto rispetto a feedback rumorosi e all'ordine del feedback. Infine, la nostra scoperta sottolinea che la creazione di dati con un obiettivo e delle linee guida appropriate costituisce un pilastro fondamentale per un ragionamento efficace. Il dataset e il modello saranno rilasciati.
English
Summarization refinement faces challenges when extending to multi-dimension. In this paper, we introduce ReFeed, a powerful summarization refinement pipeline that enhances multiple dimensions through reflective reasoning on feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based dataset optimized for training a lightweight model with reflective reasoning. Our experiments reveal how the number of dimensions, feedback exposure, and reasoning policy influence refinement performance, highlighting reflective reasoning and simultaneously addressing multiple feedback is crucial to mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy feedback and feedback order. Lastly, our finding emphasizes that creating data with a proper goal and guideline constitutes a fundamental pillar of effective reasoning. The dataset and model will be released.

Summary

AI-Generated Summary

PDF203March 31, 2025