언어 모델에서의 문화적 인식 조사: 텍스트 이상

Survey of Cultural Awareness in Language Models: Text and Beyond

October 30, 2024
저자: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI

초록

다양한 응용 프로그램에서 대규모 언어 모델 (LLM)의 대규모 배포는 챗봇과 가상 비서와 같은 응용 프로그램에서 사용자에게 문화적으로 민감하게 대응하여 포용성을 보장해야 합니다. 문화는 심리학과 인류학에서 널리 연구되어 왔으며, 최근 LLM에서 문화적 포용성을 강조하는 연구가 급증하고 있습니다. 이 연구는 다국어성을 넘어 심리학과 인류학의 연구 결과를 기반으로 한 LLM의 문화적 포용성을 강화하는 방향으로 나아가고 있습니다. 본 논문에서는 텍스트 기반 및 멀티모달 LLM에 문화적 인식을 통합하는 노력을 조사합니다. 우선, 인류학과 심리학에서 문화를 정의하고 이를 기점으로 LLM에서 문화적 인식을 살펴봅니다. 그런 다음, 다문화 데이터셋을 생성하는 방법, 하위 작업에서 문화적 포용성을 위한 전략, 그리고 LLM에서 문화적 인식을 벤치마킹하는 데 사용된 방법론을 조사합니다. 더불어 문화적 조정의 윤리적 함의, 인간-컴퓨터 상호작용의 문화적 포용성 촉진 역할, 그리고 문화적 조정이 사회과학 연구를 촉진하는 역할에 대해 논의합니다. 마지막으로, 문헌의 공백에 대한 연구 결과를 바탕으로 미래 연구를 위한 지침을 제시합니다.
English
Large-scale deployment of large language models (LLMs) in various applications, such as chatbots and virtual assistants, requires LLMs to be culturally sensitive to the user to ensure inclusivity. Culture has been widely studied in psychology and anthropology, and there has been a recent surge in research on making LLMs more culturally inclusive in LLMs that goes beyond multilinguality and builds on findings from psychology and anthropology. In this paper, we survey efforts towards incorporating cultural awareness into text-based and multimodal LLMs. We start by defining cultural awareness in LLMs, taking the definitions of culture from anthropology and psychology as a point of departure. We then examine methodologies adopted for creating cross-cultural datasets, strategies for cultural inclusion in downstream tasks, and methodologies that have been used for benchmarking cultural awareness in LLMs. Further, we discuss the ethical implications of cultural alignment, the role of Human-Computer Interaction in driving cultural inclusion in LLMs, and the role of cultural alignment in driving social science research. We finally provide pointers to future research based on our findings about gaps in the literature.

Summary

AI-Generated Summary

PDF232November 13, 2024