Accueil / Chroniques / IA et médias, (r)évolution de l’investigation ? 
π Science et technologies π Société

IA et médias, (r)évolution de l’investigation ? 

ioana manolescu bon formar
Ioana Manolescu
directrice de Recherche à l'Inria et professeure à l'École polytechnique (IP Paris)
Maxime Vaudano
Maxime Vaudano
journaliste au Monde et responsable du pôle enquêtes des Décodeurs
En bref
  • L’IA est un outil d’investigation qui s’intègre progressivement aux métiers de l’information.
  • Elle sait trier des contenus, les organiser et les relier à une base de données existante afin de gagner du temps.
  • Toutefois, elle peut passer à côté d’informations pertinentes pour traiter un sujet et nécessite une vérification humaine.
  • La capacité d’analyse, d’interview, de croisement des sources ou la réalisation d’une enquête approfondie restent des capacités exclusivement humaines à ce jour.
  • Sans être une révolution, l’IA constitue une évolution dans la relation des métiers du journalisme aux technologies.

Désor­mais omniprésente dans l’ensemble des domaines d’activité, l’Intelligence Arti­fi­cielle (IA) s’intègre aus­si pro­gres­sive­ment dans les métiers de l’information. L’IA serait-elle la prochaine révo­lu­tion dans les médias ? Pas si sûr…

Depuis une dizaine d’années, la presse en ligne teste des IA généra­tives pour rédi­ger automa­tique­ment des arti­cles en « aspi­rant » des infor­ma­tions de bases de don­nées fiables. En mars 2015 – avant Chat­G­PT – le jour­nal Le Monde avait ain­si util­isé une IA de la société Syl­labs pour rédi­ger 36 000 arti­cles cou­vrant les résul­tats des élec­tions départe­men­tales de chaque com­mune, grâce aux don­nées du min­istère de l’Intérieur. Quelques mois plus tard, France Bleu a suivi le mou­ve­ment, cette fois pour les élec­tions régionales. Depuis 2021, L’Équipe utilise égale­ment l’IA pour automa­tis­er la pro­duc­tion de con­tenus lis­tant les matchs à venir, suiv­is de l’heure et la chaîne de dif­fu­sion. Les jour­nal­istes sont-ils en train d’être rem­placés par des robots ?

IA : un outil d’investigation ?

« L’Intelligence arti­fi­cielle est d’abord un out­il » tranche Ioana Manoles­cu, chercheuse en infor­ma­tique à l’Inria, spé­cial­isée dans le traite­ment des don­nées à grande échelle et la véri­fi­ca­tion de l’information (fact check­ing).

« Dans les rédac­tions, il y a un mélange de méfi­ance et de fas­ci­na­tion » pour­suit la chercheuse. « Si la généra­tion de texte fonc­tionne bien avec les IA améri­caines – plus entraînées – les français­es sont encore mal­adroites. » De plus, la capac­ité d’analyse, d’interview, de croise­ment des sources ou la réal­i­sa­tion d’une enquête appro­fondie restent des capac­ités exclu­sive­ment humaines à ce jour. Aucun risque donc de voir les jour­nal­istes rem­placés par des « robots-rédac­teurs » au quo­ti­di­en, comme cer­tains l’envisageaient il y a une dizaine d’années.

« En revanche, les IA savent très bien récupér­er des con­tenus, les organ­is­er ou les com­par­er à une base de don­nées exis­tante » pré­cise Ioana Manoles­cu. C’est d’ailleurs l’origine de l’outil Statcheck, que la chercheuse et son équipe dévelop­pent en col­lab­o­ra­tion avec Radio France depuis 2021. Cette IA per­met de crois­er une infor­ma­tion sta­tis­tique trou­vée dans un arti­cle avec la base de don­nées de l’INSEE, et plus récem­ment d’Eurostat.

« Pour cela, il a fal­lu entraîn­er l’IA sur beau­coup de textes pour lui per­me­t­tre d’apprendre, par exem­ple, que les notions “d’emploi” et de “chô­mage” sont liées… » détaille la sci­en­tifique. Aujourd’hui, StatCheck fait seul le rap­proche­ment entre la façon d’écrire des jour­nal­istes et les dénom­i­na­tions pro­pres aux sta­tis­ti­ciens. De nou­velles fonc­tion­nal­ités con­tin­u­ent d’être ajoutées par les équipes de l’Inria, comme l’ouverture du sys­tème aux bases de don­nées extérieures, ou le « désosse­ment » puis l’uniformisation des sources dans un for­mat unique. Mais l’objectif serait d’aller plus loin…

Trier, organiser, relier

Tout est par­ti d’une enquête, menée par une jour­nal­iste du Monde il y a quelques années, qui aurait passé au peigne fin des cen­taines de doc­u­ments afin d’identifier les liens entre des sci­en­tifiques et des lob­bies indus­triels… Le tout à la main. « C’est un tra­vail colos­sal ! » com­mente Ioana Manoles­cu. L’idée est donc née de créer un out­il pour automa­tis­er le tra­vail. Bap­tisé Con­nec­tion­Lens, il est aujourd’hui capa­ble d’interconnecter des don­nées tirées d’un cor­pus de doc­u­ments très hétérogènes (PDF, Excel, URL…). « L’IA aspire les infor­ma­tions con­tenues dans ces doc­u­ments, comme des noms, organ­i­sa­tions, dates, e‑mails, etc., et les met en rela­tion. Le nom d’une entre­prise qui se retrou­ve dans les remer­ciements d’une thèse sera ain­si relié au nom de l’auteur par exem­ple », explique la chercheuse.

Mais l’algorithme n’est jamais le dernier mail­lon de la chaîne ! Pour StatCheck comme Con­nec­tion­Lens, un jour­nal­iste repasse sys­té­ma­tique­ment pour véri­fi­er le tra­vail et les sources. « Selon moi, la seule chose qu’il ne faut pas essay­er de deman­der à l’IA, c’est de réfléchir » con­clut la chercheuse.

Jamais infaillible ! Le risque des faux-négatifs

Un fonc­tion­nement que les équipes des Décodeurs du jour­nal Le Monde ont inté­gré dans leur pra­tique. « L’IA est un très bon moyen de tamiser les infos et de gag­n­er du temps, en pas­sant par exem­ple de 3 000 noms, aux 200 qui nous intéressent » témoigne Maxime Vau­dano, qui coor­donne la cel­lule d’enquête Les Décodeurs. Le jour­nal­iste, spé­cial­isé dans les enquêtes open-source et col­lab­o­ra­tives, avoue qu’ils n’ont pas « un usage très organ­isé ni très impres­sion­nant à ce stade » au sein de la rédaction.

En effet, bien que plusieurs enquêtes d’ampleur impli­quant de très gross­es bases de don­nées, comme les Pana­ma Papers, ont déjà été réal­isées par le passé à l’aide d’algorithmes plus basiques, cela ne garan­tit pas la fia­bil­ité de l’IA aujourd’hui. « Nous gar­dons en tête que c’est un out­il fail­li­ble ! Il y a bien sûr les faux-posi­tifs, qui sont les infos gardées par l’IA alors qu’elles ne sont pas per­ti­nentes, mais le plus gros risque reste les faux-négat­ifs, témoigne Maxime Vau­dano. Quand une info passe à la trappe alors qu’elle cor­re­spond à notre sujet. »

L’IA est un très bon moyen de tamiser les infos et de gag­n­er du temps.

Ain­si, l’usage de l’IA est loin d’être sys­té­ma­tique et plusieurs tech­niques « clas­siques » d’investigation sont régulière­ment util­isées en par­al­lèle. « On reste sur des recherch­es sur le très long terme avec énor­mé­ment d’étapes de véri­fi­ca­tion. » Ain­si, qu’importe la méth­ode de départ pour obtenir l’information, elle sera véri­fiée plusieurs fois… Par des humains.

Une évolution sans révolution

Alors, de révo­lu­tion à sim­ple évo­lu­tion ? C’est en tout cas l’avis d’Ioana Manoles­cu qui reste très pru­dente sur les réelles capac­ités des IA, mais égale­ment sur celles des hypothé­tiques AGI (Intel­li­gence Arti­fi­cielle Générale) du futur. « Oui, l’ordinateur peut bat­tre les humains aux échecs donc dans ce domaine : c’est fini. Mais l’on par­le ici d’un sys­tème très spé­ci­fique ! Pour le reste, les robots “intel­li­gents” ne savent pas que l’eau mouille ou que le temps ne s’écoule que dans un sens, alors qu’un bébé le sait… »

Quant à l’IA comme out­il d’investigation, la chercheuse est plus opti­miste. « Je me dis que les jeunes jour­nal­istes vont pou­voir se for­mer à ces tech­niques et les importer dans les rédac­tions. » Car l’utilisation des IA reste cor­rélée à une cer­taine cul­ture tech­nologique au sein des médias, mais aus­si aux for­ma­tions acces­si­bles aux jour­nal­istes pour pren­dre en main ces systèmes.

« On manque de temps pour met­tre en place ces out­ils, même si la tech­nolo­gie est déjà disponible » ajoute Maxime Vau­dano. Mais les lignes bougent. Reporters sans fron­tières développe depuis 2023 un pro­to­type d’IA à des­ti­na­tion des jour­nal­istes et dédié aux ques­tions envi­ron­nemen­tales et à la véri­fi­ca­tion d’information. Il est en test depuis avril 2024 au sein de 12 médias parte­naires. En par­al­lèle, le jour­nal Le Monde a noué en mars 2024 un parte­nar­i­at financier avec Ope­nAI, la société mère de Chat­G­PT, pour per­me­t­tre à leurs IA d’avoir accès à leurs archives. Une alliance scrutée avec pru­dence de la part des équipes de jour­nal­istes, mais qui inau­gure un rap­proche­ment inédit entre médias et tech­nolo­gies intelligentes.

Sophie Podevin

Le monde expliqué par la science. Une fois par semaine, dans votre boîte mail.

Recevoir la newsletter