Indagine sulla Consapevolezza Culturale nei Modelli Linguistici: Testo e Oltre

Survey of Cultural Awareness in Language Models: Text and Beyond

October 30, 2024
Autori: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI

Abstract

Il dispiegamento su larga scala dei grandi modelli linguistici (LLM) in varie applicazioni, come chatbot e assistenti virtuali, richiede che i LLM siano culturalmente sensibili all'utente per garantire l'inclusività. La cultura è stata ampiamente studiata in psicologia e antropologia, e c'è stato di recente un aumento della ricerca per rendere i LLM più culturalmente inclusivi, andando oltre la multilinguismo e basandosi sui risultati della psicologia e dell'antropologia. In questo articolo, esaminiamo gli sforzi per incorporare la consapevolezza culturale nei LLM basati su testo e multimodali. Iniziamo definendo la consapevolezza culturale nei LLM, prendendo le definizioni di cultura dall'antropologia e dalla psicologia come punto di partenza. Successivamente esaminiamo le metodologie adottate per la creazione di dataset interculturali, le strategie per l'inclusione culturale nelle attività derivate e le metodologie utilizzate per il benchmarking della consapevolezza culturale nei LLM. Inoltre, discutiamo le implicazioni etiche dell'allineamento culturale, il ruolo dell'Interazione Uomo-Computer nel promuovere l'inclusione culturale nei LLM e il ruolo dell'allineamento culturale nella guida della ricerca in scienze sociali. Infine, forniamo indicazioni per la ricerca futura basate sulle nostre scoperte riguardo alle lacune nella letteratura.
English
Large-scale deployment of large language models (LLMs) in various applications, such as chatbots and virtual assistants, requires LLMs to be culturally sensitive to the user to ensure inclusivity. Culture has been widely studied in psychology and anthropology, and there has been a recent surge in research on making LLMs more culturally inclusive in LLMs that goes beyond multilinguality and builds on findings from psychology and anthropology. In this paper, we survey efforts towards incorporating cultural awareness into text-based and multimodal LLMs. We start by defining cultural awareness in LLMs, taking the definitions of culture from anthropology and psychology as a point of departure. We then examine methodologies adopted for creating cross-cultural datasets, strategies for cultural inclusion in downstream tasks, and methodologies that have been used for benchmarking cultural awareness in LLMs. Further, we discuss the ethical implications of cultural alignment, the role of Human-Computer Interaction in driving cultural inclusion in LLMs, and the role of cultural alignment in driving social science research. We finally provide pointers to future research based on our findings about gaps in the literature.

Summary

AI-Generated Summary

PDF232November 13, 2024