Le nombre de personnes ayant des opinions extrêmes, que ce soit sur des sujets tels que la politique, la religion ou le changement climatique – pour ne citer que trois exemples – a augmenté ces dernières années123. Cette « polarisation », comme on l’appelle, est dangereuse, car elle pourrait potentiellement affaiblir la démocratie elle-même si on la laissait se répandre sans entrave. Les plateformes en ligne telles que les médias sociaux jouent un rôle important dans ce contexte, mais les mécanismes par lesquels elles favorisent la polarisation ne sont pas encore totalement compris.
« Les algorithmes de recommandation façonnent profondément notre expérience numérique aujourd’hui, en déterminant les films que nous regardons ou les chansons que nous écoutons », explique Giordano De Marzo. Ces algorithmes sont largement utilisés par la plupart des sites web que nous visitons chaque jour, les exemples les plus connus étant les messages « suggérés pour vous » sur Facebook, les « articles recommandés » sur Amazon ou le système PageRank de Google. Ils sont conçus pour nous permettre d’accéder facilement au contenu le plus susceptible de nous intéresser, pour maximiser notre engagement sur la plateforme.
Il s’agit d’une avancée significative dans la création d’un écosystème d’informations en ligne plus équilibré et plus inclusif
Une équipe de chercheurs dirigée par Giordano De Marzo, du département de physique de l’université « Sapienza » de Rome, en Italie, a étudié l’impact d’un algorithme de filtrage collaboratif d’utilisateur à utilisateur sur le comportement d’un groupe de personnes exposé répétitivement. Ce type d’algorithme de recommandation est couramment utilisé par des géants du commerce en ligne tels qu’Amazon pour identifier les nouveaux contenus – sur la base de l’activité passée – qui intéresseront le plus les utilisateurs. À l’aide de techniques analytiques et numériques, les chercheurs ont pu simuler l’évolution des préférences des utilisateurs selon les recommandations algorithmiques. Leurs analyses ont révélé trois régimes ou « phases » distincts dans les états de la base d’utilisateurs qui piègent les gens dans ce que l’on appelle des « bulles de filtre ».
Ces états dépendent de facteurs clés tels que « la force » avec laquelle l’algorithme recommande des articles appréciés par des utilisateurs similaires, ou bien qui sont populaires dans l’ensemble. L’étude a également identifié des stratégies permettant à un algorithme de fournir des recommandations personnalisées, sans créer de bulles de filtres. Cela contribuerait à l’élaboration d’algorithmes moins polarisants à l’avenir.
Le filtrage collaboratif
Le filtrage collaboratif45 est l’un des algorithmes de recommandation les plus connus et les plus utilisés. Il repose sur l’idée que le comportement passé des utilisateurs peut être exploité pour identifier les nouveaux contenus qu’ils apprécieront le plus. L’inconvénient, c’est que ces algorithmes peuvent conduire à une boucle de rétroaction. Cette boucle tend naturellement à biaiser les choix futurs, réduisant ainsi la diversité du contenu disponible. C’est une boucle de cet acabit qui conduit à des effets de bulles de filtre, où les utilisateurs ne sont pas exposés à des perspectives nouvelles ou différentes, mais simplement à des informations et des contenus alignés sur leurs croyances existantes. En clair, ces boucles participent à la « polarisation ». Elles sont similaires aux « chambres d’écho », qui ont été plus largement étudiées678. Toutefois, les bulles sont produites par des recommandations algorithmiques biaisées dans les plateformes en ligne, plutôt que par l’interaction entre des utilisateurs partageant les mêmes opinions.
Dans cette nouvelle étude, publiée dans Physical Review E, Giordano De Marzo et ses collègues ont découvert qu’en fonction de deux paramètres, la force du biais de similarité (a) et la force du biais de popularité (b), un système de filtrage collaboratif peut exister dans trois phases différentes. Il s’agit du désordre, du consensus et de la polarisation. En outre, lorsque les deux biais sont suffisamment importants, le système forme des groupes polarisés, ce qui conduit à l’effet de « bulle de filtre ». Heureusement, cet inconvénient peut être évité à la frontière entre le désordre et la polarisation. L’algorithme situé à cette limite peut fournir des recommandations significatives sans induire de polarisation de l’opinion ou de « bulles de filtres ».
« Notre recherche fournit une approche systématique pour quantifier et analyser l’impact du filtrage collaboratif utilisateur-utilisateur », explique Giordano De Marzo. « En utilisant une approche de physique statistique, nous avons pu simuler et analyser la manière dont les préférences de contenu des utilisateurs changent en réponse aux recommandations algorithmiques. »
La nouvelle méthode s’appuie sur un mélange de modélisations mathématiques et de simulations informatiques. « Nous avons notamment exploité des techniques telles que la théorie des processus stochastiques, la théorie des probabilités et les modèles d’urnes polya (une famille de modèles d’urnes permettant d’interpréter de nombreux modèles statistiques courants). Sur le plan informatique, nous avons utilisé des simulations de Monte Carlo », explique Giordano De Marzo.
Vers des algorithmes de recommandation plus efficaces
Ces analyses pourraient contribuer au développement de nouvelles méthodologies pour la conception d’algorithmes de recommandation efficaces, ajoute-t-il. « En comprenant les mécanismes qui conduisent aux « bulles de filtres », nous pouvons développer des systèmes qui favorisent un large éventail de contenus, atténuant ainsi les risques de polarisation tout en renforçant l’engagement des utilisateurs et la diversité des contenus. Il s’agit d’une avancée significative dans la création d’un écosystème d’informations en ligne plus équilibré et plus inclusif ».
Les chercheurs vont maintenant étudier l’impact des interactions entre les utilisateurs (comme on l’observe couramment dans les réseaux sociaux) sur les algorithmes de recommandation. « L’ajout de ce paramètre pourrait considérablement enrichir notre compréhension de l’interaction entre la dynamique sociale et la distribution de contenu par algorithme. Cela offrira une vision plus holistique des environnements numériques », explique Giordano De Marzo.
Ils étudieront également le rôle des algorithmes de recommandation de liens, c’est-à-dire ceux qui suggèrent des amis vers lesquels nous établirons des liens. Enfin, ils exploitent actuellement de grands modèles de langage (LLM) pour alimenter des simulations plus réalistes. « Ces simulations constitueront le point de départ idéal pour une compréhension plus détaillée de la dynamique en ligne et des algorithmes de recommandation », explique Giordano De Marzo.