Context is Key (NMF): Modelleren van de dynamiek van topische informatie in Chinese diaspora media.

Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media

October 16, 2024
Auteurs: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI

Samenvatting

Bemoeit de Volksrepubliek China (VRCH) zich met Europese verkiezingen via de etnisch Chinese diaspora media? Deze vraag vormt de basis van een lopend onderzoeksproject dat verkent hoe VRCH-narratieven over Europese verkiezingen worden vertegenwoordigd in Chinese diaspora media, en dus de doelstellingen van VRCH-nieuwsmedia manipulatie. Om diaspora media efficiënt en op grote schaal te bestuderen, is het noodzakelijk om technieken te gebruiken die zijn afgeleid van kwantitatieve tekstanalyse, zoals onderwerpmodellering. In dit artikel presenteren we een pipeline voor het bestuderen van informatie dynamiek in Chinese media. Ten eerste presenteren we KeyNMF, een nieuwe benadering voor statische en dynamische onderwerpmodellering met behulp van op transformer gebaseerde contextuele inbeddingsmodellen. We bieden benchmarkevaluaties om aan te tonen dat onze benadering concurrerend is op een aantal Chinese datasets en metrieken. Ten tweede integreren we KeyNMF met bestaande methoden om informatie dynamiek in complexe systemen te beschrijven. We passen deze pipeline toe op gegevens van vijf nieuwswebsites, met de focus op de periode voorafgaand aan de Europese parlementsverkiezingen van 2024. Onze methoden en resultaten tonen de effectiviteit van KeyNMF aan voor het bestuderen van informatie dynamiek in Chinese media en leggen de basis voor verder werk om de bredere onderzoeksvragen aan te pakken.
English
Does the People's Republic of China (PRC) interfere with European elections through ethnic Chinese diaspora media? This question forms the basis of an ongoing research project exploring how PRC narratives about European elections are represented in Chinese diaspora media, and thus the objectives of PRC news media manipulation. In order to study diaspora media efficiently and at scale, it is necessary to use techniques derived from quantitative text analysis, such as topic modelling. In this paper, we present a pipeline for studying information dynamics in Chinese media. Firstly, we present KeyNMF, a new approach to static and dynamic topic modelling using transformer-based contextual embedding models. We provide benchmark evaluations to demonstrate that our approach is competitive on a number of Chinese datasets and metrics. Secondly, we integrate KeyNMF with existing methods for describing information dynamics in complex systems. We apply this pipeline to data from five news sites, focusing on the period of time leading up to the 2024 European parliamentary elections. Our methods and results demonstrate the effectiveness of KeyNMF for studying information dynamics in Chinese media and lay groundwork for further work addressing the broader research questions.

Summary

AI-Generated Summary

PDF43November 16, 2024