IA et médias, (r)évolution de l’investigation ?
- L’IA est un outil d’investigation qui s’intègre progressivement aux métiers de l’information.
- Elle sait trier des contenus, les organiser et les relier à une base de données existante afin de gagner du temps.
- Toutefois, elle peut passer à côté d’informations pertinentes pour traiter un sujet et nécessite une vérification humaine.
- La capacité d’analyse, d’interview, de croisement des sources ou la réalisation d’une enquête approfondie restent des capacités exclusivement humaines à ce jour.
- Sans être une révolution, l’IA constitue une évolution dans la relation des métiers du journalisme aux technologies.
Désormais omniprésente dans l’ensemble des domaines d’activité, l’Intelligence Artificielle (IA) s’intègre aussi progressivement dans les métiers de l’information. L’IA serait-elle la prochaine révolution dans les médias ? Pas si sûr…
Depuis une dizaine d’années, la presse en ligne teste des IA génératives pour rédiger automatiquement des articles en « aspirant » des informations de bases de données fiables. En mars 2015 – avant ChatGPT – le journal Le Monde avait ainsi utilisé une IA de la société Syllabs pour rédiger 36 000 articles couvrant les résultats des élections départementales de chaque commune, grâce aux données du ministère de l’Intérieur. Quelques mois plus tard, France Bleu a suivi le mouvement, cette fois pour les élections régionales. Depuis 2021, L’Équipe utilise également l’IA pour automatiser la production de contenus listant les matchs à venir, suivis de l’heure et la chaîne de diffusion. Les journalistes sont-ils en train d’être remplacés par des robots ?
Cet article a été publié en exclusivité dans notre magazine Le 3,14 sur l’IA.
Téléchargez-le ici.
IA : un outil d’investigation ?
« L’Intelligence artificielle est d’abord un outil » tranche Ioana Manolescu, chercheuse en informatique à l’Inria, spécialisée dans le traitement des données à grande échelle et la vérification de l’information (fact checking).
« Dans les rédactions, il y a un mélange de méfiance et de fascination » poursuit la chercheuse. « Si la génération de texte fonctionne bien avec les IA américaines – plus entraînées – les françaises sont encore maladroites. » De plus, la capacité d’analyse, d’interview, de croisement des sources ou la réalisation d’une enquête approfondie restent des capacités exclusivement humaines à ce jour. Aucun risque donc de voir les journalistes remplacés par des « robots-rédacteurs » au quotidien, comme certains l’envisageaient il y a une dizaine d’années.
« En revanche, les IA savent très bien récupérer des contenus, les organiser ou les comparer à une base de données existante » précise Ioana Manolescu. C’est d’ailleurs l’origine de l’outil Statcheck, que la chercheuse et son équipe développent en collaboration avec Radio France depuis 2021. Cette IA permet de croiser une information statistique trouvée dans un article avec la base de données de l’INSEE, et plus récemment d’Eurostat.
« Pour cela, il a fallu entraîner l’IA sur beaucoup de textes pour lui permettre d’apprendre, par exemple, que les notions “d’emploi” et de “chômage” sont liées… » détaille la scientifique. Aujourd’hui, StatCheck fait seul le rapprochement entre la façon d’écrire des journalistes et les dénominations propres aux statisticiens. De nouvelles fonctionnalités continuent d’être ajoutées par les équipes de l’Inria, comme l’ouverture du système aux bases de données extérieures, ou le « désossement » puis l’uniformisation des sources dans un format unique. Mais l’objectif serait d’aller plus loin…
Trier, organiser, relier
Tout est parti d’une enquête, menée par une journaliste du Monde il y a quelques années, qui aurait passé au peigne fin des centaines de documents afin d’identifier les liens entre des scientifiques et des lobbies industriels… Le tout à la main. « C’est un travail colossal ! » commente Ioana Manolescu. L’idée est donc née de créer un outil pour automatiser le travail. Baptisé ConnectionLens, il est aujourd’hui capable d’interconnecter des données tirées d’un corpus de documents très hétérogènes (PDF, Excel, URL…). « L’IA aspire les informations contenues dans ces documents, comme des noms, organisations, dates, e‑mails, etc., et les met en relation. Le nom d’une entreprise qui se retrouve dans les remerciements d’une thèse sera ainsi relié au nom de l’auteur par exemple », explique la chercheuse.
Mais l’algorithme n’est jamais le dernier maillon de la chaîne ! Pour StatCheck comme ConnectionLens, un journaliste repasse systématiquement pour vérifier le travail et les sources. « Selon moi, la seule chose qu’il ne faut pas essayer de demander à l’IA, c’est de réfléchir » conclut la chercheuse.
Jamais infaillible ! Le risque des faux-négatifs
Un fonctionnement que les équipes des Décodeurs du journal Le Monde ont intégré dans leur pratique. « L’IA est un très bon moyen de tamiser les infos et de gagner du temps, en passant par exemple de 3 000 noms, aux 200 qui nous intéressent » témoigne Maxime Vaudano, qui coordonne la cellule d’enquête Les Décodeurs. Le journaliste, spécialisé dans les enquêtes open-source et collaboratives, avoue qu’ils n’ont pas « un usage très organisé ni très impressionnant à ce stade » au sein de la rédaction.
En effet, bien que plusieurs enquêtes d’ampleur impliquant de très grosses bases de données, comme les Panama Papers, ont déjà été réalisées par le passé à l’aide d’algorithmes plus basiques, cela ne garantit pas la fiabilité de l’IA aujourd’hui. « Nous gardons en tête que c’est un outil faillible ! Il y a bien sûr les faux-positifs, qui sont les infos gardées par l’IA alors qu’elles ne sont pas pertinentes, mais le plus gros risque reste les faux-négatifs, témoigne Maxime Vaudano. Quand une info passe à la trappe alors qu’elle correspond à notre sujet. »
L’IA est un très bon moyen de tamiser les infos et de gagner du temps.
Ainsi, l’usage de l’IA est loin d’être systématique et plusieurs techniques « classiques » d’investigation sont régulièrement utilisées en parallèle. « On reste sur des recherches sur le très long terme avec énormément d’étapes de vérification. » Ainsi, qu’importe la méthode de départ pour obtenir l’information, elle sera vérifiée plusieurs fois… Par des humains.
Une évolution sans révolution
Alors, de révolution à simple évolution ? C’est en tout cas l’avis d’Ioana Manolescu qui reste très prudente sur les réelles capacités des IA, mais également sur celles des hypothétiques AGI (Intelligence Artificielle Générale) du futur. « Oui, l’ordinateur peut battre les humains aux échecs donc dans ce domaine : c’est fini. Mais l’on parle ici d’un système très spécifique ! Pour le reste, les robots “intelligents” ne savent pas que l’eau mouille ou que le temps ne s’écoule que dans un sens, alors qu’un bébé le sait… »
Quant à l’IA comme outil d’investigation, la chercheuse est plus optimiste. « Je me dis que les jeunes journalistes vont pouvoir se former à ces techniques et les importer dans les rédactions. » Car l’utilisation des IA reste corrélée à une certaine culture technologique au sein des médias, mais aussi aux formations accessibles aux journalistes pour prendre en main ces systèmes.
« On manque de temps pour mettre en place ces outils, même si la technologie est déjà disponible » ajoute Maxime Vaudano. Mais les lignes bougent. Reporters sans frontières développe depuis 2023 un prototype d’IA à destination des journalistes et dédié aux questions environnementales et à la vérification d’information. Il est en test depuis avril 2024 au sein de 12 médias partenaires. En parallèle, le journal Le Monde a noué en mars 2024 un partenariat financier avec OpenAI, la société mère de ChatGPT, pour permettre à leurs IA d’avoir accès à leurs archives. Une alliance scrutée avec prudence de la part des équipes de journalistes, mais qui inaugure un rapprochement inédit entre médias et technologies intelligentes.