Comment utiliser Google pour prévoir l’activité économique des pays ?
- Depuis plusieurs années, les données Google issues des recherches effectuées sur leur site sont utilisées pour surveiller ou prévoir l’activité économique des États.
- Ces données, disponibles de façon hebdomadaire, répondent à un besoin de rapidité car les indicateurs traditionnels, tels que le PIB, mettent plus de temps à être connus.
- Les recherches Google constituent un indicateur intéressant de santé économique, car elles montrent la capacité, comme la volonté, de consommation des utilisateurs Google.
- Les indicateurs provenant de Google s’avèrent particulièrement pertinents en temps de crise, car ils réagissent rapidement aux changements de l’économie.
Pourquoi les chercheurs et les institutions, comme l’OCDE, se sont-ils tournés vers les données Google pour prévoir l’activité économique des États ? À quels besoins s’agissait-il de répondre ?
Habituellement, pour faire de la prévision macro-économique, on utilise des données qui proviennent, par exemple, des banques centrales ou d’instituts statistiques comme l’INSEE. Ces données sont très informatives, mais elles ne sont pas disponibles tout de suite. C’est pour ça que les gens s’intéressent à d’autres sources de données qui peuvent donner des informations en temps réel.
Si un décideur économique doit relancer l’économie, par exemple, il doit savoir dans quel état nous sommes aujourd’hui. Avec les séries officielles, ce n’est pas possible. Le PIB est une série trimestrielle, qui est publiée, en moyenne, un mois et demi après la fin du trimestre concerné. Il est donc impossible d’ajuster instantanément les politiques économiques. L’idée d’utiliser des sources alternatives, dont Google fait partie, c’est vraiment afin de répondre à ce problème de retard des données officielles.
Quels outils de Google sont utilisés dans ce travail de prévision macro-économique ?
Il y a deux types de données issues de Google : Google Trends et Google Search. La source première de ces deux bases de données est néanmoins la même : les mots tapés sur le moteur de recherche Google. La plupart des chercheurs utilisent Google Trends : c’est une page web à laquelle tout le monde a accès. Les données correspondent aux tendances de recherche par pays et par catégorie (divertissement, entreprise, santé, science, sport). Google assigne le mot-clé de la recherche à une catégorie.
Les recherches Google peuvent être vues comme une synthèse de la façon dont les gens perçoivent l’économie.
Google Search fournit quant à lui des séries issues des recherches sur Internet, mises à disposition par Google et données à la Banque centrale européenne. Les deux bases de données sont construites de façon différente, Google Trends regarde le volume de recherches tandis que Google Search donne des informations sur la variation du volume. Dans mon étude, c’est avec les données de Google Search que nous avons travaillé.
Il s’agit donc de prévoir la santé des économies, en analysant ce que les utilisateurs de Google tapent dans le moteur de recherche. D’où vient cette idée et en quoi ces données sont-elles pertinentes ?
Les premiers papiers sur la question ont été publiés par Hal Varian, économiste en chef chez Google. Ces données sont assez récentes : elles sont disponibles depuis 2004, mais j’ai commencé mon projet d’utilisation de données Google en 2016. L’intuition et le présupposé derrière l’utilisation de ces données pour faire de la prévision macroéconomique, c’est que les recherches Google peuvent être vues comme une synthèse de la façon dont les gens perçoivent l’économie. Si l’économie est en bonne santé, les gens ont tendance à faire des recherches sur la culture, les voyages, etc… En revanche, s’il y a des problèmes de chômage, il y aura plus de recherches liées à l’emploi.
Ces données sont-elles efficaces pour prévoir l’activité économique d’un pays ? Est-ce utile pour prédire les périodes de croissance et de récession ?
Ce que j’ai observé dans ma recherche, c’est que ces outils sont particulièrement utiles dans les périodes de crise. Pendant la crise de 2008–2009, par exemple, les données Google ont bien anticipé l’activité économique car elles sont plus réactives au changement, par rapport aux données officielles.
Cependant, les séries issues de Google sont très peu corrélées avec le PIB. Sauf en période de crise, les informations officielles restent quand même plus informatives. Il est, par ailleurs, essentiel de faire une présélection, car on compte à peu près 300 catégories par pays. Si on les utilise toutes, cela crée du bruit dans le processus d’estimation. Avant de faire de la prévision, il faut donc sélectionner les catégories de Google les plus corrélées pour prédire le PIB. Si c’est fait, on peut trouver des résultats intéressants, y compris pour les périodes stables, même quand on ne dispose pas d’informations officielles.
Quelles catégories de recherche sont les plus utiles pour prévoir l’activité économique ?
Les catégories les plus corrélées sont souvent liées à la consommation, comme ce qui est lié aux loisirs et au divertissement. Cela s’explique facilement : si on est dans une bonne période économique, les gens ont plus envie d’acheter. Il faut aussi considérer les catégories liées aux réseaux sociaux. Les gens peuvent être plus ou moins actifs dans leur utilisation des réseaux sociaux, selon l’état économique : s’informer sur les plateformes ou consulter des sites comme LinkedIn pour trouver des offres d’emploi, par exemple.
Quels sont les avantages et les limites des données Google par rapport aux données officielles ?
Le principal avantage par rapport aux données officielles est une question de temps. En effet, l’aperçu de l’économie est presque instantané : on écoute les informations, on voit qu’il y a une guerre ou une crise politique, on réagit tout de suite, on adapte notre comportement. Malgré tout, les industries prennent beaucoup plus de temps à s’adapter à une crise économique, cela ne se fait pas du jour au lendemain. La plupart des acteurs de l’économie réagissent plus tardivement.
Le principal avantage par rapport aux données officielles est une question de temps.
La principale limite, c’est que ces données sont difficiles à exploiter. Dans mon étude, nous avons essayé plusieurs méthodes, et certaines ne fonctionnaient pas du tout. Par exemple, la méthode de présélection des catégories de recherche marche seulement dans une période stable : en période de crise, il ne faut pas présélectionner.
Comment imaginez-vous l’avenir de la prévision économique, en termes de sources de données ? Est-ce que vous pensez que l’utilisation Google va continuer à se développer ?
J’imagine qu’il n’y aura pas une seule source de données qui deviendra meilleure que d’autres : on va continuer à utiliser plusieurs sources et plusieurs modèles. Selon le contexte économique, on aura des meilleures prévisions avec certaines données. Ce qu’il faut faire maintenant, en plus d’automatiser encore plus les méthodes qu’on a mises en place, c’est comparer la performance des données Google en termes de prévision par rapport à d’autres données alternatives, comme les textes venant des journaux qui suivent l’actualité économique et financière : c’est ce que j’essaie d’appliquer dans ma recherche.