Cartographie du paysage médiatique : Prédiction du reportage factuel et du biais politique à travers les interactions web
Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions
October 23, 2024
Auteurs: Dairazalia Sánchez-Cortés, Sergio Burdisso, Esaú Villatoro-Tello, Petr Motlicek
cs.AI
Résumé
L'évaluation des biais des sources d'information est primordiale pour les professionnels, les organisations et les chercheurs qui se fient à des preuves fiables pour la collecte et la diffusion d'informations. Alors que certains indicateurs de biais sont discernables à partir de l'analyse du contenu, des descripteurs tels que le biais politique et les fausses nouvelles posent des défis plus importants. Dans cet article, nous proposons une extension à une méthode d'estimation de la fiabilité des médias d'information récemment présentée, qui se concentre sur la modélisation des médias et de leurs interactions web longitudinales. Concrètement, nous évaluons les performances de classification de quatre stratégies d'apprentissage par renforcement sur un grand graphe d'hyperliens de médias d'information. Nos expériences, ciblant deux descripteurs de biais difficiles, à savoir le reporting factuel et le biais politique, ont montré une amélioration significative des performances au niveau des médias sources. De plus, nous validons nos méthodes lors du défi du laboratoire CheckThat! de CLEF 2023, surpassant les résultats rapportés à la fois en termes de score F1 et de la métrique MAE officielle. En outre, nous contribuons en publiant le plus grand ensemble de données annotées de médias sources d'information, catégorisés avec des étiquettes de reporting factuel et de biais politique. Nos résultats suggèrent que le profilage des sources de médias d'information en fonction de leurs interactions d'hyperliens dans le temps est réalisable, offrant une vue d'ensemble des paysages médiatiques en évolution.
English
Bias assessment of news sources is paramount for professionals,
organizations, and researchers who rely on truthful evidence for information
gathering and reporting. While certain bias indicators are discernible from
content analysis, descriptors like political bias and fake news pose greater
challenges. In this paper, we propose an extension to a recently presented news
media reliability estimation method that focuses on modeling outlets and their
longitudinal web interactions. Concretely, we assess the classification
performance of four reinforcement learning strategies on a large news media
hyperlink graph. Our experiments, targeting two challenging bias descriptors,
factual reporting and political bias, showed a significant performance
improvement at the source media level. Additionally, we validate our methods on
the CLEF 2023 CheckThat! Lab challenge, outperforming the reported results in
both, F1-score and the official MAE metric. Furthermore, we contribute by
releasing the largest annotated dataset of news source media, categorized with
factual reporting and political bias labels. Our findings suggest that
profiling news media sources based on their hyperlink interactions over time is
feasible, offering a bird's-eye view of evolving media landscapes.Summary
AI-Generated Summary