Covid-19 : une mortalité plus élevée qu’il n’y paraît
Depuis le début de la pandémie, les données d’infectivité ou de mortalité liées à la Covid-19 mobilisent l’attention du monde entier. Pourtant, aucun de ces deux paramètres n’est totalement fiable. En mars, lors du premier confinement, Nicolas Chopin, professeur en statistique et science des données à l’École nationale de la statistique et de l’administration économique (ENSAE) s’est lancé dans une analyse plus approfondie des chiffres fournis par les autorités françaises. À l’instar d’autres chercheurs, il a découvert que les taux de mortalité de la Covid-19 étaient probablement sous-estimés.
Pendant le confinement, vous avez examiné les données relatives à la pandémie sous un angle différent. Qu’avez-vous constaté ?
Au début de la crise, tout le monde ne parlait que de la Covid-19 et je tenais à me rendre utile, d’une manière ou d’une autre. En tant que professeur en statistique et science des données, je me suis mis en quête de données publiques. Au départ, mon intention était de comparer l’évolution de la pandémie entre les pays, mais je me suis rapidement rendu compte que c’était impossible. Comme les méthodes de dépistage varient énormément d’un pays à l’autre, en particulier au début de la pandémie, il était évident que le nombre de nouveaux cas ne permettait pas d’établir une comparaison fiable.
Je me suis donc intéressé au nombre de décès. L’accès aux données n’a pas posé problème en France, où les deux principaux instituts de statistique – Santé publique France et l’Institut national de la statistique et des études économiques (INSEE) – fournissent quotidiennement des chiffres très précis. Au fur et à mesure de la progression de la pandémie, les données mises à disposition ont par ailleurs gagné en qualité.
Malgré tout, ces données ne vous ont pas apporté entière satisfaction non plus. Pourquoi ?
Tout d’abord, bien que Santé publique France communique d’énormes volumes de données émanant des établissements de santé, celles-ci sont limitées puisqu’elles concernent uniquement les patients hospitalisés. Ensuite, pour ce qui est de l’INSEE, les chiffres des décès survenus depuis mars sont très nombreux, mais ils ne renseignent aucunement sur les causes, ce qui les rend difficiles à interpréter isolément. En revanche, ces deux sources conjuguées apportent un éclairage précieux sur la progression de la pandémie en France.
J’ai commencé par comparer les chiffres de la mortalité communiqués par l’INSEE les années précédentes à ceux de cette année. Naturellement, on constate une augmentation : c’est le taux de surmortalité, à savoir le nombre de cas supplémentaires par rapport aux chiffres escomptés, lequel s’est avéré en moyenne 60 % plus élevé que celui des décès imputables à la Covid-19 fourni par Santé publique France. Cette différence s’explique probablement en grande partie par la prise en compte des décès liés à l’épidémie survenus en maisons de retraite. Elle pourrait toutefois être due à des causes connexes, comme le défaut de traitement d’autres pathologies liées à la pandémie.
Par la suite, j’ai analysé les mêmes données en établissant une distinction entre hommes et femmes. J’ai constaté que le coefficient pour les hommes était de 1,56, contre 2,40 pour les femmes. Rien de surprenant à cela, sachant qu’il y a en moyenne trois fois plus de femmes que d’hommes dans les maisons de retraite en France. Le fait que ces structures soient beaucoup moins bien équipées pour recueillir et partager des données explique l’écart entre les chiffres.
En fin de compte, cela vous a‑t-il permis de comparer les données françaises à celles d’autres pays comme vous l’escomptiez au départ ?
J’ai contacté des confrères en Italie, en Espagne, en Angleterre et en Allemagne. Mais aucun autre pays ne disposait de données aussi récentes que les nôtres. Ainsi, Public Health England, l’équivalent anglais de Santé publique France, n’a pas été en mesure de fournir systématiquement des chiffres actualisés, si bien que les corpus étaient beaucoup plus lacunaires qu’ici. En France, nous avons rencontré des problèmes de ce genre par le passé. La canicule de 2003 a entraîné la mort de nombreuses personnes âgées. À l’époque, les données publiques sur la mortalité étaient moins fournies, et ce sont les entrepreneurs de pompes funèbres, débordés, qui avaient tiré la sonnette d’alarme. Aujourd’hui, les données sont facilement accessibles.
Vos travaux ont uniquement été publiés sur votre blog mais ils ont suscité un intérêt certain. Comment les choses se sont-elles passées ?
Ce qu’il faut bien comprendre, c’est que beaucoup de gens auraient pu en faire autant. L’analyse à laquelle je me suis livré est si simple qu’elle aurait pu être réalisée par un étudiant de premier cycle. Elle montre toutefois que la science des données implique avant tout de disposer d’un corpus pertinent. D’autres que moi sont arrivés à la même conclusion, sans avoir connaissance de mes travaux. Des journalistes spécialisés du New York Times ont, par exemple, publié un article sur le taux de surmortalité, qui a ensuite été repris par le Guardian et Le Monde.
De mon côté, j’ai été invité à participer à une table ronde de l’Académie des sciences en présence d’autres statisticiens qui se consacraient à divers aspects de la pandémie. Par ailleurs, un spécialiste américain des données, Gaurav Sood, a pris contact avec moi. Il a publié sur son propre blog des travaux encore plus approfondis à partir de mes analyses, en calculant l’âge moyen par décès dans différents pays. L’idée qui sous-tend cette démarche, c’est que beaucoup d’entre nous ont tendance à se dire que « ceux qui succombent sont âgés et seraient morts de toute façon ». À l’inverse, M. Sood a montré que ceux qui sont décédés de la Covid-19 avaient perdu neuf ans d’espérance de vie en moyenne.
En dehors de l’Allemagne, très peu de pays disposent de données totalement fiables concernant le nombre de cas. Dans certains pays où les dépistages font défaut, comme en Bolivie, le seul moyen de suivre l’évolution de la pandémie consiste à observer la surmortalité. La situation de la France est en quelque sorte intermédiaire. Nous bénéficions de données sur le nombre de cas, mais le taux de surmortalité peut nous permettre de mieux interpréter les chiffres, en les comparant entre eux. Aux États-Unis, les cas de Covid-19 ne sont pas correctement recensés. Il s’agit d’une question délicate sur le plan politique. Selon moi, assurer le libre accès aux données et leur transparence est indispensable au bon fonctionnement d’une démocratie.
Vos conclusions sur l’analyse de la surmortalité valent-elles toujours pour la deuxième vague ?
Les données ne sont pas encore toutes disponibles : la deuxième vague est en cours et les chiffres sur la mortalité, toutes causes confondues, sont publiées avec deux semaines de décalage. Cependant, au vu des données accessibles pour l’instant, il me semble que le phénomène observé lors de la première vague est moins marqué. En d’autres termes, la différence entre la mortalité due à la Covid-19 en milieu hospitalier, d’une part, et la surmortalité, d’autre part, est toujours présente, mais elle est moins prononcée. À ce stade, toute explication reste évidemment très hypothétique, mais il se peut tout simplement que les EHPAD soient aujourd’hui davantage en mesure de faire face à l’épidémie.
Pour en savoir plus, allez sur le blog de Nicolas Chopin ici.