Cartographie du paysage médiatique : Prédiction du reportage factuel et du biais politique à travers les interactions web

Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions

October 23, 2024
Auteurs: Dairazalia Sánchez-Cortés, Sergio Burdisso, Esaú Villatoro-Tello, Petr Motlicek
cs.AI

Résumé

L'évaluation des biais des sources d'information est primordiale pour les professionnels, les organisations et les chercheurs qui se fient à des preuves fiables pour la collecte et la diffusion d'informations. Alors que certains indicateurs de biais sont discernables à partir de l'analyse du contenu, des descripteurs tels que le biais politique et les fausses nouvelles posent des défis plus importants. Dans cet article, nous proposons une extension à une méthode d'estimation de la fiabilité des médias d'information récemment présentée, qui se concentre sur la modélisation des médias et de leurs interactions web longitudinales. Concrètement, nous évaluons les performances de classification de quatre stratégies d'apprentissage par renforcement sur un grand graphe d'hyperliens de médias d'information. Nos expériences, ciblant deux descripteurs de biais difficiles, à savoir le reporting factuel et le biais politique, ont montré une amélioration significative des performances au niveau des médias sources. De plus, nous validons nos méthodes lors du défi du laboratoire CheckThat! de CLEF 2023, surpassant les résultats rapportés à la fois en termes de score F1 et de la métrique MAE officielle. En outre, nous contribuons en publiant le plus grand ensemble de données annotées de médias sources d'information, catégorisés avec des étiquettes de reporting factuel et de biais politique. Nos résultats suggèrent que le profilage des sources de médias d'information en fonction de leurs interactions d'hyperliens dans le temps est réalisable, offrant une vue d'ensemble des paysages médiatiques en évolution.
English
Bias assessment of news sources is paramount for professionals, organizations, and researchers who rely on truthful evidence for information gathering and reporting. While certain bias indicators are discernible from content analysis, descriptors like political bias and fake news pose greater challenges. In this paper, we propose an extension to a recently presented news media reliability estimation method that focuses on modeling outlets and their longitudinal web interactions. Concretely, we assess the classification performance of four reinforcement learning strategies on a large news media hyperlink graph. Our experiments, targeting two challenging bias descriptors, factual reporting and political bias, showed a significant performance improvement at the source media level. Additionally, we validate our methods on the CLEF 2023 CheckThat! Lab challenge, outperforming the reported results in both, F1-score and the official MAE metric. Furthermore, we contribute by releasing the largest annotated dataset of news source media, categorized with factual reporting and political bias labels. Our findings suggest that profiling news media sources based on their hyperlink interactions over time is feasible, offering a bird's-eye view of evolving media landscapes.

Summary

AI-Generated Summary

PDF52November 16, 2024