Le contexte est clé (NMF) : Modélisation de la dynamique de l'information thématique dans les médias de la diaspora chinoise
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
October 16, 2024
Auteurs: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI
Résumé
La République populaire de Chine (RPC) interfère-t-elle dans les élections européennes à travers les médias de la diaspora chinoise ? Cette question constitue la base d'un projet de recherche en cours explorant comment les récits de la RPC sur les élections européennes sont représentés dans les médias de la diaspora chinoise, et donc les objectifs de la manipulation des médias d'information de la RPC. Afin d'étudier efficacement et à grande échelle les médias de la diaspora, il est nécessaire d'utiliser des techniques issues de l'analyse textuelle quantitative, telles que la modélisation de sujets. Dans cet article, nous présentons un pipeline pour étudier la dynamique de l'information dans les médias chinois. Tout d'abord, nous présentons KeyNMF, une nouvelle approche de modélisation de sujets statiques et dynamiques utilisant des modèles d'encastrement contextuels basés sur des transformateurs. Nous fournissons des évaluations de référence pour démontrer que notre approche est compétitive sur un certain nombre d'ensembles de données et de métriques chinoises. Deuxièmement, nous intégrons KeyNMF avec des méthodes existantes pour décrire la dynamique de l'information dans des systèmes complexes. Nous appliquons ce pipeline à des données provenant de cinq sites d'actualités, en mettant l'accent sur la période précédant les élections parlementaires européennes de 2024. Nos méthodes et résultats démontrent l'efficacité de KeyNMF pour étudier la dynamique de l'information dans les médias chinois et posent les bases pour de futurs travaux abordant des questions de recherche plus larges.
English
Does the People's Republic of China (PRC) interfere with European elections
through ethnic Chinese diaspora media? This question forms the basis of an
ongoing research project exploring how PRC narratives about European elections
are represented in Chinese diaspora media, and thus the objectives of PRC news
media manipulation. In order to study diaspora media efficiently and at scale,
it is necessary to use techniques derived from quantitative text analysis, such
as topic modelling. In this paper, we present a pipeline for studying
information dynamics in Chinese media. Firstly, we present KeyNMF, a new
approach to static and dynamic topic modelling using transformer-based
contextual embedding models. We provide benchmark evaluations to demonstrate
that our approach is competitive on a number of Chinese datasets and metrics.
Secondly, we integrate KeyNMF with existing methods for describing information
dynamics in complex systems. We apply this pipeline to data from five news
sites, focusing on the period of time leading up to the 2024 European
parliamentary elections. Our methods and results demonstrate the effectiveness
of KeyNMF for studying information dynamics in Chinese media and lay groundwork
for further work addressing the broader research questions.Summary
AI-Generated Summary