Accueil / Chroniques / Comment utiliser Google pour prévoir l’activité économique des pays ?
π Numérique π Économie

Comment utiliser Google pour prévoir l’activité économique des pays ?

SIMONI Anna
Anna Simoni
directrice de recherche au CNRS et professeure d'Économétrie et Statistiques à l'ENSAE (IP Paris)
En bref
  • Depuis plusieurs années, les données Google issues des recherches effectuées sur leur site sont utilisées pour surveiller ou prévoir l’activité économique des États.
  • Ces données, disponibles de façon hebdomadaire, répondent à un besoin de rapidité car les indicateurs traditionnels, tels que le PIB, mettent plus de temps à être connus.
  • Les recherches Google constituent un indicateur intéressant de santé économique, car elles montrent la capacité, comme la volonté, de consommation des utilisateurs Google.
  • Les indicateurs provenant de Google s’avèrent particulièrement pertinents en temps de crise, car ils réagissent rapidement aux changements de l’économie.

Pourquoi les chercheurs et les institutions, comme l’OCDE, se sont-ils tournés vers les données Google pour prévoir l’activité économique des États ? À quels besoins s’agissait-il de répondre ? 

Habituelle­ment, pour faire de la prévi­sion macro-économique, on utilise des don­nées qui provi­en­nent, par exem­ple, des ban­ques cen­trales ou d’instituts sta­tis­tiques comme l’INSEE. Ces don­nées sont très infor­ma­tives, mais elles ne sont pas disponibles tout de suite. C’est pour ça que les gens s’intéressent à d’autres sources de don­nées qui peu­vent don­ner des infor­ma­tions en temps réel. 

Si un décideur économique doit relancer l’économie, par exem­ple, il doit savoir dans quel état nous sommes aujourd’hui. Avec les séries offi­cielles, ce n’est pas pos­si­ble. Le PIB est une série trimestrielle, qui est pub­liée, en moyenne, un mois et demi après la fin du trimestre con­cerné. Il est donc impos­si­ble d’ajuster instan­ta­né­ment les poli­tiques économiques. L’idée d’utiliser des sources alter­na­tives, dont Google fait par­tie, c’est vrai­ment afin de répon­dre à ce prob­lème de retard des don­nées officielles. 

Quels outils de Google sont utilisés dans ce travail de prévision macro-économique ?

Il y a deux types de don­nées issues de Google : Google Trends et Google Search. La source pre­mière de ces deux bases de don­nées est néan­moins la même : les mots tapés sur le moteur de recherche Google. La plu­part des chercheurs utilisent Google Trends : c’est une page web à laque­lle tout le monde a accès. Les don­nées cor­re­spon­dent aux ten­dances de recherche par pays et par caté­gorie (diver­tisse­ment, entre­prise, san­té, sci­ence, sport). Google assigne le mot-clé de la recherche à une catégorie. 

Les recherch­es Google peu­vent être vues comme une syn­thèse de la façon dont les gens perçoivent l’économie.

Google Search four­nit quant à lui des séries issues des recherch­es sur Inter­net, mis­es à dis­po­si­tion par Google et don­nées à la Banque cen­trale européenne. Les deux bases de don­nées sont con­stru­ites de façon dif­férente, Google Trends regarde le vol­ume de recherch­es tan­dis que Google Search donne des infor­ma­tions sur la vari­a­tion du vol­ume. Dans mon étude, c’est avec les don­nées de Google Search que nous avons travaillé. 

Il s’agit donc de prévoir la santé des économies, en analysant ce que les utilisateurs de Google tapent dans le moteur de recherche. D’où vient cette idée et en quoi ces données sont-elles pertinentes ? 

Les pre­miers papiers sur la ques­tion ont été pub­liés par Hal Var­i­an, écon­o­miste en chef chez Google. Ces don­nées sont assez récentes : elles sont disponibles depuis 2004, mais j’ai com­mencé mon pro­jet d’utilisation de don­nées Google en 2016. L’intuition et le pré­sup­posé der­rière l’utilisation de ces don­nées pour faire de la prévi­sion macroé­conomique, c’est que les recherch­es Google peu­vent être vues comme une syn­thèse de la façon dont les gens perçoivent l’économie. Si l’économie est en bonne san­té, les gens ont ten­dance à faire des recherch­es sur la cul­ture, les voy­ages, etc… En revanche, s’il y a des prob­lèmes de chô­mage, il y aura plus de recherch­es liées à l’emploi.  

Ces données sont-elles efficaces pour prévoir l’activité économique d’un pays ? Est-ce utile pour prédire les périodes de croissance et de récession ? 

Ce que j’ai observé dans ma recherche, c’est que ces out­ils sont par­ti­c­ulière­ment utiles dans les péri­odes de crise. Pen­dant la crise de 2008–2009, par exem­ple, les don­nées Google ont bien anticipé l’activité économique car elles sont plus réac­tives au change­ment, par rap­port aux don­nées officielles.

Cepen­dant, les séries issues de Google sont très peu cor­rélées avec le PIB. Sauf en péri­ode de crise, les infor­ma­tions offi­cielles restent quand même plus infor­ma­tives. Il est, par ailleurs, essen­tiel de faire une présélec­tion, car on compte à peu près 300 caté­gories par pays. Si on les utilise toutes, cela crée du bruit dans le proces­sus d’estimation. Avant de faire de la prévi­sion, il faut donc sélec­tion­ner les caté­gories de Google les plus cor­rélées pour prédire le PIB. Si c’est fait, on peut trou­ver des résul­tats intéres­sants, y com­pris pour les péri­odes sta­bles, même quand on ne dis­pose pas d’informations officielles. 

Quelles catégories de recherche sont les plus utiles pour prévoir l’activité économique ? 

Les caté­gories les plus cor­rélées sont sou­vent liées à la con­som­ma­tion, comme ce qui est lié aux loisirs et au diver­tisse­ment. Cela s’explique facile­ment : si on est dans une bonne péri­ode économique, les gens ont plus envie d’acheter. Il faut aus­si con­sid­ér­er les caté­gories liées aux réseaux soci­aux. Les gens peu­vent être plus ou moins act­ifs dans leur util­i­sa­tion des réseaux soci­aux, selon l’état économique : s’informer sur les plate­formes ou con­sul­ter des sites comme LinkedIn pour trou­ver des offres d’emploi, par exemple. 

Quels sont les avantages et les limites des données Google par rapport aux données officielles ? 

Le prin­ci­pal avan­tage par rap­port aux don­nées offi­cielles est une ques­tion de temps. En effet, l’aperçu de l’économie est presque instan­ta­né : on écoute les infor­ma­tions, on voit qu’il y a une guerre ou une crise poli­tique, on réag­it tout de suite, on adapte notre com­porte­ment. Mal­gré tout, les indus­tries pren­nent beau­coup plus de temps à s’adapter à une crise économique, cela ne se fait pas du jour au lende­main. La plu­part des acteurs de l’économie réagis­sent plus tardivement. 

Le prin­ci­pal avan­tage par rap­port aux don­nées offi­cielles est une ques­tion de temps. 

La prin­ci­pale lim­ite, c’est que ces don­nées sont dif­fi­ciles à exploiter. Dans mon étude, nous avons essayé plusieurs méth­odes, et cer­taines ne fonc­tion­naient pas du tout. Par exem­ple, la méth­ode de présélec­tion des caté­gories de recherche marche seule­ment dans une péri­ode sta­ble : en péri­ode de crise, il ne faut pas présélectionner. 

Comment imaginez-vous l’avenir de la prévision économique, en termes de sources de données ? Est-ce que vous pensez que l’utilisation Google va continuer à se développer ?

J’imagine qu’il n’y aura pas une seule source de don­nées qui devien­dra meilleure que d’autres : on va con­tin­uer à utilis­er plusieurs sources et plusieurs mod­èles. Selon le con­texte économique, on aura des meilleures prévi­sions avec cer­taines don­nées. Ce qu’il faut faire main­tenant, en plus d’automatiser encore plus les méth­odes qu’on a mis­es en place, c’est com­par­er la per­for­mance des don­nées Google en ter­mes de prévi­sion par rap­port à d’autres don­nées alter­na­tives, comme les textes venant des jour­naux qui suiv­ent l’actualité économique et finan­cière : c’est ce que j’essaie d’appliquer dans ma recherche.

Propos recueillis par Sirine Azouaoui

Le monde expliqué par la science. Une fois par semaine, dans votre boîte mail.

Recevoir la newsletter