Détection de la Fiabilité des Sources d'Information et des Biais Politiques : Une Nouvelle Approche pour l'Analyse des Informations Médiatiques

Prédire et analyser les biais politiques, ainsi que vérifier la fiabilité des sources, pourrait constituer une solution révolutionnaire pour les professionnels et les organisations dans une société où la désinformation est quotidienne. C'est ce sur quoi une équipe de l'Idiap, sous la supervision du Dr. Petr Motlicek, a travaillé en proposant une nouvelle approche pour l'analyse des informations médiatiques.

La technologie développée vise à estimer le biais politique et la fiabilité des médias à travers la manière dont ces derniers se lient les uns aux autres sur une longue période, ou à travers leurs "interactions web longitudinales". Cette approche diffère des modèles existants qui reposent sur les métadonnées des réseaux sociaux ou l'analyse du contenu, où l'évaluation manuelle est cruciale et chronophage, et où, à ce jour, les grands modèles de langage (LLM) échouent encore à fournir des résultats fiables et vérifiés.


Pour prouver leur hypothèse, l'équipe exploite des graphes à grande échelle de sources d'information connectées par des hyperliens, formant un réseau d'interactions médiatiques. Ils ont démontré que la fiabilité factuelle et les biais politiques pouvaient être prédits en analysant la manière dont les sources médiatiques interagissent, indépendamment de la langue ou du contenu, en combinant des interactions passées et futures et un ensemble initial d'étiquettes de vérité terrain grâce à des algorithmes d'apprentissage par renforcement.


Ces résultats marquent une avancée dans l'automatisation du profilage des biais médiatiques, qui dépendait traditionnellement de la vérification manuelle des faits. Au-delà de l'identification des rapports factuels et des biais politiques, cette approche offre un outil plus large pour comprendre le dynamisme du paysage médiatique, ouvrant la voie à de futures recherches sur les changements de biais politiques et d'autres caractéristiques des médias.


L'équipe de recherche a également publié la plus grande base de données annotées de sources d'information classées par fiabilité factuelle et biais politique. Cette base de données comprend plus de 17 000 médias, offrant une ressource pour de futures études sur le profilage des médias et la détection des biais.

Cette recherche a été soutenue par le programme Horizon 2020 de l'UE dans le cadre du projet CRiTERIA qui vise à relier différents types de preuves, comme les événements, les tendances et les risques, aux résultats de l'analyse des menaces liées à la migration.


L'article associé est disponible à l'adresse suivante : https://publications.idiap.ch/publications/show/5368