Le contexte est clé (NMF) : Modélisation de la dynamique de l'information thématique dans les médias de la diaspora chinoise

Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media

October 16, 2024
Auteurs: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI

Résumé

La République populaire de Chine (RPC) interfère-t-elle dans les élections européennes à travers les médias de la diaspora chinoise ? Cette question constitue la base d'un projet de recherche en cours explorant comment les récits de la RPC sur les élections européennes sont représentés dans les médias de la diaspora chinoise, et donc les objectifs de la manipulation des médias d'information de la RPC. Afin d'étudier efficacement et à grande échelle les médias de la diaspora, il est nécessaire d'utiliser des techniques issues de l'analyse textuelle quantitative, telles que la modélisation de sujets. Dans cet article, nous présentons un pipeline pour étudier la dynamique de l'information dans les médias chinois. Tout d'abord, nous présentons KeyNMF, une nouvelle approche de modélisation de sujets statiques et dynamiques utilisant des modèles d'encastrement contextuels basés sur des transformateurs. Nous fournissons des évaluations de référence pour démontrer que notre approche est compétitive sur un certain nombre d'ensembles de données et de métriques chinoises. Deuxièmement, nous intégrons KeyNMF avec des méthodes existantes pour décrire la dynamique de l'information dans des systèmes complexes. Nous appliquons ce pipeline à des données provenant de cinq sites d'actualités, en mettant l'accent sur la période précédant les élections parlementaires européennes de 2024. Nos méthodes et résultats démontrent l'efficacité de KeyNMF pour étudier la dynamique de l'information dans les médias chinois et posent les bases pour de futurs travaux abordant des questions de recherche plus larges.
English
Does the People's Republic of China (PRC) interfere with European elections through ethnic Chinese diaspora media? This question forms the basis of an ongoing research project exploring how PRC narratives about European elections are represented in Chinese diaspora media, and thus the objectives of PRC news media manipulation. In order to study diaspora media efficiently and at scale, it is necessary to use techniques derived from quantitative text analysis, such as topic modelling. In this paper, we present a pipeline for studying information dynamics in Chinese media. Firstly, we present KeyNMF, a new approach to static and dynamic topic modelling using transformer-based contextual embedding models. We provide benchmark evaluations to demonstrate that our approach is competitive on a number of Chinese datasets and metrics. Secondly, we integrate KeyNMF with existing methods for describing information dynamics in complex systems. We apply this pipeline to data from five news sites, focusing on the period of time leading up to the 2024 European parliamentary elections. Our methods and results demonstrate the effectiveness of KeyNMF for studying information dynamics in Chinese media and lay groundwork for further work addressing the broader research questions.

Summary

AI-Generated Summary

PDF43November 16, 2024