Typed-RAG: Typbewusste Multi-Aspekt-Zerlegung für die Beantwortung nicht-faktischer Fragen
Typed-RAG: Type-aware Multi-Aspect Decomposition for Non-Factoid Question Answering
March 20, 2025
Autoren: DongGeon Lee, Ahjeong Park, Hyeri Lee, Hyeonseo Nam, Yunho Maeng
cs.AI
Zusammenfassung
Die Beantwortung nicht-faktischer Fragen (Non-factoid Question-Answering, NFQA) stellt eine erhebliche Herausforderung dar, da sie durch ihren offenen Charakter, vielfältige Intentionen und die Notwendigkeit einer mehrdimensionalen Argumentation gekennzeichnet ist. Dies macht konventionelle Ansätze zur Beantwortung faktischer Fragen, einschließlich retrieval-augmentierter Generierung (Retrieval-Augmented Generation, RAG), unzureichend. Im Gegensatz zu faktischen Fragen haben nicht-faktische Fragen (Non-factoid Questions, NFQs) keine eindeutigen Antworten und erfordern die Synthese von Informationen aus mehreren Quellen über verschiedene Argumentationsdimensionen hinweg. Um diese Einschränkungen zu überwinden, führen wir Typed-RAG ein, ein typbewusstes, mehrdimensionales Dekompositionsframework innerhalb des RAG-Paradigmas für NFQA. Typed-RAG klassifiziert NFQs in verschiedene Typen – wie Debatte, Erfahrung und Vergleich – und wendet aspektbasierte Dekomposition an, um die Retrieval- und Generierungsstrategien zu verfeinern. Durch die Zerlegung mehrdimensionaler NFQs in ein-dimensionale Teilfragen und die Aggregation der Ergebnisse generiert Typed-RAG informativer und kontextuell relevantere Antworten. Zur Bewertung von Typed-RAG stellen wir Wiki-NFQA vor, einen Benchmark-Datensatz, der verschiedene NFQ-Typen abdeckt. Experimentelle Ergebnisse zeigen, dass Typed-RAG die Baselines übertrifft und damit die Bedeutung der typbewussten Dekomposition für effektives Retrieval und Generierung in NFQA unterstreicht. Unser Code und der Datensatz sind verfügbar unter https://github.com/TeamNLP/Typed-RAG{https://github.com/TeamNLP/Typed-RAG}.
English
Non-factoid question-answering (NFQA) poses a significant challenge due to
its open-ended nature, diverse intents, and the need for multi-aspect
reasoning, which renders conventional factoid QA approaches, including
retrieval-augmented generation (RAG), inadequate. Unlike factoid questions,
non-factoid questions (NFQs) lack definitive answers and require synthesizing
information from multiple sources across various reasoning dimensions. To
address these limitations, we introduce Typed-RAG, a type-aware multi-aspect
decomposition framework within the RAG paradigm for NFQA. Typed-RAG classifies
NFQs into distinct types -- such as debate, experience, and comparison -- and
applies aspect-based decomposition to refine retrieval and generation
strategies. By decomposing multi-aspect NFQs into single-aspect sub-queries and
aggregating the results, Typed-RAG generates more informative and contextually
relevant responses. To evaluate Typed-RAG, we introduce Wiki-NFQA, a benchmark
dataset covering diverse NFQ types. Experimental results demonstrate that
Typed-RAG outperforms baselines, thereby highlighting the importance of
type-aware decomposition for effective retrieval and generation in NFQA. Our
code and dataset are available at
https://github.com/TeamNLP/Typed-RAG{https://github.com/TeamNLP/Typed-RAG}.Summary
AI-Generated Summary