Untersuchung des kulturellen Bewusstseins in Sprachmodellen: Text und darüber hinaus
Survey of Cultural Awareness in Language Models: Text and Beyond
October 30, 2024
Autoren: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI
Zusammenfassung
Der groß angelegte Einsatz großer Sprachmodelle (LLMs) in verschiedenen Anwendungen wie Chatbots und virtuellen Assistenten erfordert, dass LLMs kulturell sensibel auf den Benutzer eingehen, um Inklusivität sicherzustellen. Kultur wurde ausgiebig in der Psychologie und Anthropologie erforscht, und es gab einen kürzlichen Anstieg an Forschungsbemühungen, um LLMs kulturell inklusiver zu gestalten, was über Mehrsprachigkeit hinausgeht und auf Erkenntnissen aus Psychologie und Anthropologie aufbaut. In diesem Artikel untersuchen wir Bemühungen zur Integration kultureller Sensibilität in textbasierte und multimodale LLMs. Wir beginnen mit der Definition von kultureller Sensibilität in LLMs, wobei wir die Definitionen von Kultur aus Anthropologie und Psychologie als Ausgangspunkt nehmen. Anschließend untersuchen wir die Methodologien, die für die Erstellung interkultureller Datensätze übernommen wurden, Strategien für kulturelle Inklusion in nachgelagerten Aufgaben und Methodologien, die zur Bewertung der kulturellen Sensibilität in LLMs verwendet wurden. Des Weiteren diskutieren wir die ethischen Implikationen der kulturellen Ausrichtung, die Rolle der Mensch-Computer-Interaktion bei der Förderung kultureller Inklusion in LLMs und die Rolle der kulturellen Ausrichtung bei der Förderung sozialwissenschaftlicher Forschung. Abschließend geben wir Hinweise für zukünftige Forschung basierend auf unseren Erkenntnissen über Lücken in der Literatur.
English
Large-scale deployment of large language models (LLMs) in various
applications, such as chatbots and virtual assistants, requires LLMs to be
culturally sensitive to the user to ensure inclusivity. Culture has been widely
studied in psychology and anthropology, and there has been a recent surge in
research on making LLMs more culturally inclusive in LLMs that goes beyond
multilinguality and builds on findings from psychology and anthropology. In
this paper, we survey efforts towards incorporating cultural awareness into
text-based and multimodal LLMs. We start by defining cultural awareness in
LLMs, taking the definitions of culture from anthropology and psychology as a
point of departure. We then examine methodologies adopted for creating
cross-cultural datasets, strategies for cultural inclusion in downstream tasks,
and methodologies that have been used for benchmarking cultural awareness in
LLMs. Further, we discuss the ethical implications of cultural alignment, the
role of Human-Computer Interaction in driving cultural inclusion in LLMs, and
the role of cultural alignment in driving social science research. We finally
provide pointers to future research based on our findings about gaps in the
literature.Summary
AI-Generated Summary