ChatPaper.aiChatPaper

대규모 언어 모델을 위한 신뢰할 수 있는 검색 증강 생성을 향하여: 조사

Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey

February 8, 2025
저자: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
cs.AI

초록

검색 보강 생성 (RAG)은 인공지능 생성 콘텐츠 (AIGC)의 도전에 대응하기 위해 고안된 고급 기술입니다. 문맥 검색을 콘텐츠 생성에 통합함으로써 RAG는 신뢰할 수 있고 최신의 외부 지식을 제공하며 환각을 줄이고 다양한 작업에서 관련 문맥을 보장합니다. 그러나 RAG의 성공과 잠재력에도 불구하고 최근 연구에 따르면 RAG 패러다임은 새로운 위험 요소를 도입하는 것으로 나타났습니다. 이에는 견고성 문제, 개인정보 보호 문제, 적대적 공격, 그리고 책임 문제 등이 포함됩니다. 이러한 위험을 해결하는 것은 RAG 시스템의 미래 응용에 있어서 중요한데, 이는 그들의 신뢰성에 직접적인 영향을 미치기 때문입니다. RAG 방법의 신뢰성을 향상시키기 위해 다양한 방법이 개발되었지만, 이 주제에 대한 통합된 시각과 프레임워크가 부족합니다. 따라서 본 논문에서는 신뢰할 수 있는 RAG 시스템을 개발하기 위한 포괄적인 로드맵을 제시하여 이 간극을 해소하고자 합니다. 우리는 신뢰성, 개인정보 보호, 안전성, 공정성, 설명 가능성, 그리고 책임성이라는 다섯 가지 핵심 시각을 중심으로 논의를 전개합니다. 각 시각에 대해 우리는 일반적인 프레임워크와 분류법을 제시하여 현재의 도전에 대한 이해, 기존 솔루션의 평가, 그리고 유망한 미래 연구 방향을 식별하는 구조화된 접근을 제공합니다. 보다 넓은 채택과 혁신을 촉진하기 위해, 우리는 또한 신뢰할 수 있는 RAG 시스템이 중요한 영향을 미치는 하류 응용 분야를 강조합니다.
English
Retrieval-Augmented Generation (RAG) is an advanced technique designed to address the challenges of Artificial Intelligence-Generated Content (AIGC). By integrating context retrieval into content generation, RAG provides reliable and up-to-date external knowledge, reduces hallucinations, and ensures relevant context across a wide range of tasks. However, despite RAG's success and potential, recent studies have shown that the RAG paradigm also introduces new risks, including robustness issues, privacy concerns, adversarial attacks, and accountability issues. Addressing these risks is critical for future applications of RAG systems, as they directly impact their trustworthiness. Although various methods have been developed to improve the trustworthiness of RAG methods, there is a lack of a unified perspective and framework for research in this topic. Thus, in this paper, we aim to address this gap by providing a comprehensive roadmap for developing trustworthy RAG systems. We place our discussion around five key perspectives: reliability, privacy, safety, fairness, explainability, and accountability. For each perspective, we present a general framework and taxonomy, offering a structured approach to understanding the current challenges, evaluating existing solutions, and identifying promising future research directions. To encourage broader adoption and innovation, we also highlight the downstream applications where trustworthy RAG systems have a significant impact.

Summary

AI-Generated Summary

PDF82February 13, 2025