Accueil / Chroniques / IA générative : quelles sont les prochaines étapes ?
Eye of futuristic and Innovative Imagery AI and Automation use of artificial intelligence and automation in business processes, illustrating efficiency and productivity enhancements
π Science et technologies π Numérique

IA générative : quelles sont les prochaines étapes ?

Andrew Rogoyski
Andrew Rogoyski
directeur de l'innovation pour le Surrey Institute for People-Centred AI
En bref
  • L'IA progresse à une vitesse fulgurante, et son rythme de développement ne risque pas de ralentir.
  • Certains développements, comme l'IA multimodale, l’assistance virtuelle ainsi que la recherche automatisée par l'IA sont à portée de main.
  • Toutefois, le développement de l’IA n’est à ce jour par rentable et est dominé par quelques grandes organisations commerciales.
  • Des avancées plus importantes, telles que celles des robots et des mentors (tuteurs, conseillers d’orientation…) alimentés par l'IA, semblent encore lointaines, mais sont susceptibles de se produire.
  • Face à ces évolutions, les organismes de réglementation doivent arbitrer les usages de l’IA.

L’IA est une avancée qui ne date pas d’hier. Mais au cours de ces deux dernières années, alors que le grand public ne faisait que la découvrir, elle a progressé à une vitesse fulgurante. Andrew Rogoyski nous expose son point de vue sur ce qui nous attend. Quelles sont les nouvelles fonctionnalités puissantes que l’on peut attendre de l’IA ?

Cet arti­cle a été pub­lié en exclu­siv­ité dans notre mag­a­zine Le 3,14 sur l’IA.
Téléchargez-le ici.

Il con­vient de pré­cis­er que lorsque nous util­isons le terme « IA », nous nous con­cen­trons actuelle­ment sur l’« IA généra­tive » ou « GenAI » que des plate­formes telles que Chat­G­PT d’Ope­nAI ont mis au point au cours des deux dernières années. D’autres pro­grès impor­tants, réal­isés par des acteurs du monde entier, devraient bien­tôt voir le jour. D’ailleurs, il existe déjà une feuille de route.

L’un d’en­tre eux con­cerne l’IA qui devient de plus en plus mul­ti­modale. Cela sig­ni­fie que les grands mod­èles de lan­gage (LLM) appren­dront et com­pren­dront le texte, la vidéo et le son, ain­si que la manière dont ils sont liés les uns aux autres. Cer­tains mod­èles sont déjà en train de franchir cette bar­rière et d’ar­riv­er sur les marchés. Les IA monomodales comme Copi­lot peu­vent génér­er des images à par­tir de textes et vice ver­sa. Sora peut génér­er des vidéos à par­tir de textes. Run­way et Pika Labs pro­posent égale­ment de la généra­tion d’im­ages à par­tir de vidéos. Les nou­veaux grands mod­èles mul­ti­modaux (LMM) d’Ope­nAI, Meta, Google et d’autres, peu­vent génér­er de la vidéo à par­tir d’une image, d’un texte et d’autres modes de don­nées. Par exem­ple, cer­tains mod­èles GenAI répon­dent à des ques­tions textuelles sur le con­tenu des vidéos. De nom­breux secteurs sont con­cernés et les stu­dios d’Hol­ly­wood éval­u­ent rapi­de­ment ce que cela pour­rait sig­ni­fi­er pour l’in­dus­trie ciné­matographique. L’un des incon­vénients de cette tech­nolo­gie puis­sante est qu’il est pos­si­ble de créer des « deep­fakes » (trucages hyper­réal­istes) assez com­plex­es avec des bud­gets modestes. 

Un autre grand pro­grès atten­du est que l’IA devi­enne un out­il invis­i­ble. Au lieu de devoir se con­necter à une plate­forme dédiée sur un ordi­na­teur ou un télé­phone, nous pour­rons con­vers­er avec nos voitures, nos télé­phones et nos appareils élec­tromé­nagers et obtenir des répons­es naturelles. Plusieurs entre­pris­es tra­vail­lent sur ce sujet : Apple avec Apple Intel­li­gence, Google avec Google IA, Ama­zon avec Alexa, etc. 

L’é­tape suiv­ante con­siste à faire en sorte que l’IA agisse comme une sorte d’a­gent en votre nom, en lui per­me­t­tant de réserv­er des voy­ages, des séjours à l’hô­tel, etc. Pour l’in­stant, la GenAI n’est pas très douée pour la plan­i­fi­ca­tion. C’est ce sur quoi Ope­nAI ain­si que d’autres tra­vail­lent, afin d’obtenir une GenAI capa­ble de décom­pos­er un prob­lème en étapes et de pren­dre des mesures en fonc­tion de ces étapes. La ques­tion est de savoir quelle autorité vous don­nerez à un agent pour qu’il agisse en votre nom. Il est prob­a­ble que ces agents inter­a­giront avec d’autres agents, ce qui don­nera lieu à des dis­cus­sions et à des négo­ci­a­tions sans inter­ven­tion humaine.

Une autre évo­lu­tion impor­tante sera l’amélio­ra­tion de la recherche d’in­for­ma­tions par l’IA. Ce sujet peut sem­bler assez ennuyeux, mais il est vrai­ment pas­sion­nant en ter­mes de pro­duc­tiv­ité. Les entre­pris­es col­lectent des mil­liers de doc­u­ments con­tenant des inter­ac­tions avec leurs clients, des offres, des poli­tiques, des procé­dures et d’autres infor­ma­tions utiles. Cepen­dant, la récupéra­tion de ces infor­ma­tions est générale­ment médiocre. La GenAI pour­rait être la solu­tion au prob­lème de la « ges­tion des con­nais­sances » des entre­pris­es. Ne serait-il pas mer­veilleux de pou­voir deman­der à son ordi­na­teur portable : « Quel était ce grand appel d’of­fre que nous avons lancé il y a trois ans en parte­nar­i­at avec cette banque ? » et qu’il déduise les bonnes répons­es et vous donne un résumé plutôt qu’une série de doc­u­ments que vous devez lire ?

Bien sûr, avant de pou­voir faire cela, nous devons nous atta­quer à la fameuse « hal­lu­ci­na­tion » de l’IA, qui sont les fauss­es infor­ma­tions générées par l’IA. Nous avons dévelop­pé une tech­nolo­gie qui per­met « d’hal­lu­cin­er » des images, des sons, des poèmes, etc. Mais nous sommes moins ent­hou­si­astes à l’idée qu’elle puisse « hal­lu­cin­er » les comptes d’une entre­prise ou un dossier médi­cal. L’as­tuce con­sis­tera main­tenant à ren­dre cette inter­face con­ver­sa­tion­nelle vrai­ment pra­tique et à la reli­er à des faits con­crets. L’IA généra­tive peut engen­dr­er des absur­dités, ce qui peut être un gros prob­lème. Récem­ment, Air Cana­da a fait l’ob­jet d’une procé­dure devant le tri­bunal des petites créances1 de la part d’un pas­sager qui avait ten­té de deman­der rétroac­tive­ment le rem­bourse­ment de son bil­let après avoir véri­fié la poli­tique de la com­pag­nie en matière de deuil sur sa chat­bot ali­men­tée par l’IA. L’IA a cru que les pas­sagers pou­vaient deman­der un rem­bourse­ment dans les 90 jours suiv­ant le voy­age, ce qui ne fig­ure pas dans la poli­tique de la com­pag­nie. Le tri­bunal a don­né rai­son au passager. 

Une partie de l’avancée de l’IA consistera à en limiter le coût, n’est-ce pas ?

Oui, le coût de d’exploitation de ces mod­èles aujour­d’hui, en ter­mes d’én­ergie, de refroidisse­ment et de puis­sance de cal­cul, les rend non viables, tant sur le plan com­mer­cial que dans le con­texte de la crise cli­ma­tique. Les entre­pris­es sont sus­cep­ti­bles de pass­er des unités de traite­ment graphique (GPU) exis­tantes à du matériel conçu pour les appli­ca­tions d’IA. 

Apple dis­pose d’une « unité de traite­ment neu­ronal », Google a une « unité de traite­ment ten­soriel », Microsoft, IBM, Ama­zon, Sam­sung et d’autres dévelop­pent tous du matériel spé­cial­isé capa­ble d’améliorer les per­for­mances cent fois, mille fois plus effi­cace­ment que les GPU et les CPU. Ces puces sont mas­sive­ment opti­misées pour les opéra­tions matricielles au cœur des algo­rithmes d’ap­pren­tis­sage automatique.

De nou­velles archi­tec­tures de puces sont égale­ment pro­posées pour faire fonc­tion­ner ces mod­èles avec une très faible con­som­ma­tion d’én­ergie. C’est le cas de la puce North Pole AI d’IBM2, par  exem­ple, qui promet de réduire la puis­sance des appli­ca­tions typ­iques d’un fac­teur 253. Google­tra­vaille égale­ment sur sa Ten­sor Pro­cess­ing Unit pour accélér­er le traite­ment de l’IA et la Lan­guage Pro­cess­ing Unit de Groq est égale­ment prometteuse.

Il existe égale­ment des archi­tec­tures plus ésotériques, telles que les puces neu­ro­mor­phiques. Celles-ci sont conçues pour pren­dre en charge les réseaux de neu­rones à pointes, des mod­èles infor­ma­tiques qui imi­tent le fonc­tion­nement du cerveau humain. Pour l’in­stant, ces archi­tec­tures sont surtout util­isées dans le domaine uni­ver­si­taire, mais elles com­men­cent à s’é­ten­dre à d’autres champs. 

Qu’en est-il du fait que l’IA est fortement dominée par quelques entités commerciales à l’heure actuelle ?

Il y a actuelle­ment un grand débat sur l’ou­ver­ture des LLM à l’open source. En rai­son de l’am­pleur des opéra­tions néces­saires au développe­ment des LLM et des LMM, les organ­i­sa­tions com­mer­ciales ont été à l’a­vant-garde du développe­ment. Env­i­ron 80 à 90 % d’en­tre eux sont dévelop­pés par des organ­i­sa­tions com­mer­ciales. Cela sig­ni­fie que la tech­nolo­gie est restée prin­ci­pale­ment entre les mains de ses pro­prié­taires, à quelques excep­tions nota­bles près, comme le LLa­MA de Meta et le Large et Code­stral de Mis­tral, qui ont été mis en open source très tôt. Il existe égale­ment des LLM/LMM com­mu­nau­taires à code source ouvert tels que Platy­pus, Bloom et Fal­con.

D’une part, un plus grand nom­bre de per­son­nes expéri­mentent et s’amusent avec cette tech­nolo­gie ce qui pour­rait déclencher de nou­velles avancées, expos­er des vul­néra­bil­ités, etc. D’autre part, il y a des gens qui utilis­eront cette tech­nolo­gie à mau­vais escient. La plu­part des mod­èles intè­grent actuelle­ment des dis­posi­tifs de sécu­rité pour empêch­er les gens de faire ce qu’ils veu­lent, mais il est rel­a­tive­ment facile de les con­tourn­er. Et, cer­tains mod­èles à code source ouvert sont disponibles à l’é­tat « brut », sans garde-fous. Nous pou­vons nous atten­dre à ce que la GenAI à code source ouvert con­tin­ue à se dévelop­per. Cela va de pair avec la volon­té de dévelop­per des mod­èles plus petits et plus durables, dont le fonc­tion­nement ne néces­site pas des cen­taines de mil­lions de dollars. 

À quels problèmes peut-on s’attendre en termes d’utilisation abusive de ces nouvelles technologies ?

La cyber­sécu­rité restera un prob­lème majeur. Les organ­i­sa­tions crim­inelles appren­nent déjà rapi­de­ment à exploiter cette tech­nolo­gie. Elles ont déjà com­mencé à utilis­er l’IA généra­tive pour ratio­nalis­er la sur­veil­lance en ligne, exploiter les don­nées his­toriques à la recherche de vul­néra­bil­ités ou encore, automa­tis­er des attaques à l’aide de faux textes. Les escrocs utilisent égale­ment des « deep­fakes » pour soutir­er de l’ar­gent aux entre­pris­es. La police de Hong Kong a récem­ment procédé à six arresta­tions4 dans le cadre d’une escro­querie com­plexe qui a dépouil­lée la société d’ingénierie bri­tan­nique Arup5 de 25 mil­lions de dol­lars. L’un des employés de la société a été entraîné dans une vidéo­con­férence avec ce qu’il pen­sait être son directeur financier. Il s’est avéré qu’il s’agis­sait d’une vidéo « deep­fake ». Ces « deep­fakes » ciblent égale­ment les inten­tions des électeurs avec des infor­ma­tions erronées. Il s’ag­it d’une ten­dance très dan­gereuse et d’une men­ace réelle pour cette année, 2024 étant l’an­née où se tien­dront le plus grand nom­bre d’élec­tions jamais organ­isées par l’Homme dans son Histoire. 

Alors que les cyber-escrocs con­tin­ueront à s’amélior­er, les défenseurs de l’autre côté appren­nent égale­ment, util­isant l’IA généra­tive et d’autres formes d’IA pour trou­ver les attaquants. Dans le monde de la cyber­sécu­rité, il y a un cycle con­stant d’at­taque et de défense. L’u­til­i­sa­tion de l’IA dans un con­texte mil­i­taire fait égale­ment l’ob­jet d’un grand débat. L’IA est déjà util­isée pour analyser l’im­agerie satel­lite ou assur­er la nav­i­ga­tion des drones, mais on ne sait pas encore si elle peut être util­isée pour ôter la vie à des êtres humains. À l’heure actuelle, il est moins coû­teux de ne pas équiper les drones d’IA, même si c’est tech­nique­ment pos­si­ble. À mon avis, il s’ag­it là d’une lim­ite très impor­tante à ne pas franchir. Nous ne voulons pas entr­er dans un monde où nous devons nous bat­tre à la vitesse d’une machine et où notre adver­saire est une IA – il n’y aurait alors qu’un pas vers les mon­des dystopiques des films Ter­mi­na­tor de James Cameron ou de la série Matrix des sœurs Wachowski.

Nous constatons une certaine évolution de la part des organismes de réglementation.

Une régle­men­ta­tion com­mence à voir le jour. La loi de l’U­nion européenne sur l’IA est entrée en vigueur6 en août 2023 et les détails ont été final­isés en avril de cette année. Tout le monde sur­veillera l’im­pact de la lég­is­la­tion européenne. Un décret prési­den­tiel améri­cain pub­lié7 en octo­bre 2023 a intro­duit une longue liste de con­trôles, y com­pris des rap­ports statu­taires au-delà d’un cer­tain niveau de puis­sance de cal­cul et de mise en réseau. On peut s’at­ten­dre à ce que les États-Unis, le Roy­aume-Uni et d’autres pays adoptent bien­tôt d’autres lois. 

La sci­ence-fic­tion a la fâcheuse habi­tude de devenir une réal­ité scientifique.

Toute­fois, si l’on ne demande pas des comptes à ceux qui dévelop­pent l’IA, cette régle­men­ta­tion n’au­ra qu’une portée lim­itée. Pour l’in­stant, c’est le règne de la lib­erté. Si la tech­nolo­gie met des mil­lions de per­son­nes au chô­mage ou provoque une épidémie de trou­bles men­taux, les entre­pris­es peu­vent hauss­er les épaules et dire qu’elles ne con­trô­lent pas la manière dont les gens utilisent cette tech­nolo­gie. D’un autre côté, si les grandes entre­pris­es sont les seules organ­i­sa­tions désireuses ou capa­bles d’in­ve­stir les dizaines de mil­liards néces­saires au développe­ment de ces sys­tèmes d’IA, per­son­ne ne veut blo­quer le proces­sus et ris­quer de se laiss­er dis­tancer par d’autres pays.

Nous avons besoin d’une lég­is­la­tion et d’une régle­men­ta­tion qui ren­dent les organ­i­sa­tions et les indi­vidus respon­s­ables de l’im­pact de leurs tech­nolo­gies. Cela les oblig­erait à réfléchir soigneuse­ment à la manière dont leur tech­nolo­gie sera util­isée et leur imposerait d’ex­plor­er et de tester cor­recte­ment l’im­pact de leur tech­nolo­gie. Vous pou­vez con­stater qu’il s’ag­it d’un sujet de ten­sion pour cer­taines entre­pris­es de GenAI. Par exem­ple, Ope­nAI a per­du plusieurs de ses dirigeants8, cha­cun d’en­tre eux faisant allu­sion au manque de super­vi­sion dans le développe­ment de GenAI. 

Y a‑t-il autre chose que nous devrions surveiller ?

Il y a des avancées qui se pro­fi­lent à l’hori­zon, et on peut les voir arriv­er. Et elles seront très impor­tantes. Je pense que la con­ver­gence de l’in­for­ma­tique quan­tique et de l’IA sera intéres­sante. Cer­taines entre­pris­es, comme IBM, présen­tent désor­mais leurs feuilles de route en matière d’in­for­ma­tique quan­tique. IBM prévoit 200 qubits et 100 mil­lions de portes de cal­cul d’ici 20299. Il s’ag­it d’une tech­nolo­gie très puis­sante qui pour­rait per­me­t­tre à l’IA d’ap­pren­dre en temps réel, ce qui est vrai­ment passionnant.

Au cours des 12 derniers mois env­i­ron, des per­son­nes ont appliqué l’ap­proche des grands mod­èles de lan­gage à la robo­t­ique, ce que l’on appelle les mod­èles Vision Lan­guage Action (VLA). De la même manière que nous avons con­stru­it des mod­èles de base pour le texte et les images, nous pour­rions être en mesure de les con­stru­ire pour la per­cep­tion, l’ac­tion et le mou­ve­ment robo­t­ique. L’ob­jec­tif est de par­venir à ce que, par exem­ple, vous puissiez dire à un robot de ramass­er une banane et qu’il ait suff­isam­ment de con­nais­sances générales pour non seule­ment repér­er la banane avec son cap­teur, mais aus­si savoir ce qu’il doit en faire, sans avoir besoin d’une entrée algo­rith­mique spé­ci­fique. Il s’ag­it d’une avancée intéres­sante dans le domaine de la robo­t­ique, car elle per­met à l’IA d’ap­pren­dre à par­tir de l’ex­péri­ence physique et du monde réel. 

Les men­tors de l’IA pour­raient con­stituer une autre avancée majeure. Les IA sont déjà util­isées pour génér­er du matériel d’ap­pren­tis­sage, mais on peut imag­in­er un monde où une IA scanne votre CV et est capa­ble de vous sug­gér­er des for­ma­tions, des lec­tures, etc. Les IA pour­raient égale­ment jouer le rôle de tuteurs, en vous guidant dans vos études, en vous sug­gérant des méth­odes d’ap­pren­tis­sage, en vous faisant pass­er des exa­m­ens et des éval­u­a­tions, et en suiv­ant votre évo­lu­tion. Des écoles pilo­tent déjà l’u­til­i­sa­tion de GenAI en tant que tuteurs. Par exem­ple, le David Game Col­lege de Lon­dres10 teste un GCSE accéléré dans lequel les étu­di­ants ne reçoivent que des cours d’IA. Vous entrez dans la boucle éduca­tive et la mod­i­fiez entièrement.

La ques­tion qui se pose est alors la suiv­ante : pourquoi iriez-vous à l’u­ni­ver­sité ? Pourquoi iriez-vous à l’é­cole, si ce n’est pour ses avan­tages soci­aux ? L’IA pour­rait chang­er fon­da­men­tale­ment notre façon d’ap­pren­dre et d’en­seign­er. Cer­tains pour­raient s’in­quiéter du fait que nous com­men­cions à con­stru­ire de nou­veaux sys­tèmes édu­cat­ifs qui dépen­dent des entre­pris­es tech­nologiques améri­caines, plutôt que d’êtres humains qual­i­fiés dans le pays.

Quel est le calendrier prévu pour ces avancées ?

Je pense que ce que nous avons appris ces deux dernières années, c’est que les choses peu­vent arriv­er très vite. Elles ne sont jamais aus­si far­felues que nous l’imag­i­nons – la sci­ence-fic­tion a la fâcheuse habi­tude de devenir une réal­ité sci­en­tifique. Je dirais même qu’une grande par­tie de la sci­ence-fic­tion est très proche de la réalité. 

Nous devons main­tenant com­mencer à réfléchir aux con­séquences de tout cela. Quel est le rôle de l’hu­man­ité dans cet avenir ? À quoi ressem­blent les économies si les humains sont exclus de l’équa­tion ? À quoi ressem­blent la vérité et la démoc­ra­tie lorsque tout peut être truqué ? À quoi ressem­blera l’é­d­u­ca­tion, fonde­ment de notre qual­ité de vie mod­erne, dans l’avenir ? Ce sont de très grandes ques­tions fon­da­men­tales aux­quelles je pense que per­son­ne n’a la réponse à l’heure actuelle. 

Propos recueillis par Marianne Guenot

1https://​www​.cbsnews​.com/​n​e​w​s​/​a​i​r​c​a​n​a​d​a​-​c​h​a​t​b​o​t​-​d​i​s​c​o​u​n​t​-​c​u​s​t​omer/
2https://​research​.ibm​.com/​b​l​o​g​/​n​o​r​t​h​p​o​l​e​-​i​b​m​-​a​i​-chip
3https://​spec​trum​.ieee​.org/​n​e​u​r​o​m​o​r​p​h​i​c​-​c​o​m​p​u​t​i​n​g​-​i​b​m​-​n​o​r​t​hpole
4https://​edi​tion​.cnn​.com/​2​0​2​4​/​0​2​/​0​4​/​a​s​i​a​/​d​e​e​p​f​a​k​e​-​c​f​o​-​s​c​a​m​-​h​o​n​g​-​k​o​n​g​-​i​n​t​l​-​h​n​k​/​i​n​d​e​x​.html
5https://​www​.ft​.com/​c​o​n​t​e​n​t​/​b​9​7​7​e​8​d​4​-​6​6​4​c​-​4​a​e​4​-​8​a​8​e​-​e​b​9​3​b​d​f​785ea
6https://commission.europa.eu/news/ai-act-enters-force-2024–08-01_en
7https://​www​.ft​.com/​c​o​n​t​e​n​t​/​b​9​7​7​e​8​d​4​-​6​6​4​c​-​4​a​e​4​-​8​a​8​e​-​e​b​9​3​b​d​f​785ea
8https://www.ft.com/content/638f67f7-5375–47fc-b3a7-af7c9e05b9e0
9https://​www​.ibm​.com/​r​o​a​d​m​a​p​s​/​q​u​a​n​t​u​m.pdf
10https://​www​.bbc​.co​.uk/​s​o​u​n​d​s​/​p​l​a​y​/​m​0​0​21x2v

Le monde expliqué par la science. Une fois par semaine, dans votre boîte mail.

Recevoir la newsletter