Onderzoek naar Cultureel Bewustzijn in Taalmodellen: Tekst en Verder
Survey of Cultural Awareness in Language Models: Text and Beyond
October 30, 2024
Auteurs: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI
Samenvatting
De grootschalige implementatie van grote taalmodellen (LLM's) in verschillende toepassingen, zoals chatbots en virtuele assistenten, vereist dat LLM's cultureel gevoelig zijn voor de gebruiker om inclusiviteit te waarborgen. Cultuur is uitgebreid bestudeerd in de psychologie en antropologie, en er is recentelijk een toename geweest in onderzoek naar het maken van LLM's die cultureel inclusiever zijn dan alleen meertaligheid, en voortbouwen op bevindingen uit de psychologie en antropologie. In dit artikel onderzoeken we inspanningen om cultureel bewustzijn te integreren in op tekst gebaseerde en multimodale LLM's. We beginnen met het definiëren van cultureel bewustzijn in LLM's, waarbij we de definities van cultuur uit de antropologie en psychologie als vertrekpunt nemen. Vervolgens onderzoeken we de methodologieën die zijn aangenomen voor het creëren van interculturele datasets, strategieën voor culturele inclusie in taken, en methodologieën die zijn gebruikt voor het benchmarken van cultureel bewustzijn in LLM's. Daarnaast bespreken we de ethische implicaties van culturele afstemming, de rol van mens-computerinteractie bij het bevorderen van culturele inclusie in LLM's, en de rol van culturele afstemming bij het bevorderen van sociaalwetenschappelijk onderzoek. Tot slot geven we aanwijzingen voor toekomstig onderzoek op basis van onze bevindingen over lacunes in de literatuur.
English
Large-scale deployment of large language models (LLMs) in various
applications, such as chatbots and virtual assistants, requires LLMs to be
culturally sensitive to the user to ensure inclusivity. Culture has been widely
studied in psychology and anthropology, and there has been a recent surge in
research on making LLMs more culturally inclusive in LLMs that goes beyond
multilinguality and builds on findings from psychology and anthropology. In
this paper, we survey efforts towards incorporating cultural awareness into
text-based and multimodal LLMs. We start by defining cultural awareness in
LLMs, taking the definitions of culture from anthropology and psychology as a
point of departure. We then examine methodologies adopted for creating
cross-cultural datasets, strategies for cultural inclusion in downstream tasks,
and methodologies that have been used for benchmarking cultural awareness in
LLMs. Further, we discuss the ethical implications of cultural alignment, the
role of Human-Computer Interaction in driving cultural inclusion in LLMs, and
the role of cultural alignment in driving social science research. We finally
provide pointers to future research based on our findings about gaps in the
literature.Summary
AI-Generated Summary