Context is Key (NMF): Modelleren van de dynamiek van topische informatie in Chinese diaspora media.
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
October 16, 2024
Auteurs: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI
Samenvatting
Bemoeit de Volksrepubliek China (VRCH) zich met Europese verkiezingen via de etnisch Chinese diaspora media? Deze vraag vormt de basis van een lopend onderzoeksproject dat verkent hoe VRCH-narratieven over Europese verkiezingen worden vertegenwoordigd in Chinese diaspora media, en dus de doelstellingen van VRCH-nieuwsmedia manipulatie. Om diaspora media efficiënt en op grote schaal te bestuderen, is het noodzakelijk om technieken te gebruiken die zijn afgeleid van kwantitatieve tekstanalyse, zoals onderwerpmodellering. In dit artikel presenteren we een pipeline voor het bestuderen van informatie dynamiek in Chinese media. Ten eerste presenteren we KeyNMF, een nieuwe benadering voor statische en dynamische onderwerpmodellering met behulp van op transformer gebaseerde contextuele inbeddingsmodellen. We bieden benchmarkevaluaties om aan te tonen dat onze benadering concurrerend is op een aantal Chinese datasets en metrieken. Ten tweede integreren we KeyNMF met bestaande methoden om informatie dynamiek in complexe systemen te beschrijven. We passen deze pipeline toe op gegevens van vijf nieuwswebsites, met de focus op de periode voorafgaand aan de Europese parlementsverkiezingen van 2024. Onze methoden en resultaten tonen de effectiviteit van KeyNMF aan voor het bestuderen van informatie dynamiek in Chinese media en leggen de basis voor verder werk om de bredere onderzoeksvragen aan te pakken.
English
Does the People's Republic of China (PRC) interfere with European elections
through ethnic Chinese diaspora media? This question forms the basis of an
ongoing research project exploring how PRC narratives about European elections
are represented in Chinese diaspora media, and thus the objectives of PRC news
media manipulation. In order to study diaspora media efficiently and at scale,
it is necessary to use techniques derived from quantitative text analysis, such
as topic modelling. In this paper, we present a pipeline for studying
information dynamics in Chinese media. Firstly, we present KeyNMF, a new
approach to static and dynamic topic modelling using transformer-based
contextual embedding models. We provide benchmark evaluations to demonstrate
that our approach is competitive on a number of Chinese datasets and metrics.
Secondly, we integrate KeyNMF with existing methods for describing information
dynamics in complex systems. We apply this pipeline to data from five news
sites, focusing on the period of time leading up to the 2024 European
parliamentary elections. Our methods and results demonstrate the effectiveness
of KeyNMF for studying information dynamics in Chinese media and lay groundwork
for further work addressing the broader research questions.Summary
AI-Generated Summary