Cet article vous est offert
Pour lire gratuitement cet article réservé aux abonnés, connectez-vous
Vous n'êtes pas inscrit sur Le Monde ?

Grippe, dengue, tuberculose, comment Wikipedia permet de prédire les épidémies

Une équipe de chercheurs américains a développé un outil de prévision qui se révèle rapide et précis selon des résultats préliminaires.

Par 

Publié le 13 novembre 2014 à 21h52, modifié le 19 août 2019 à 14h18

Temps de Lecture 3 min.

L’analyse des pages vues de l’encyclopédie en ligne Wikipedia pourraient constituer une méthode de détection précoce des épidémies et même de les anticiper, avant que le système traditionnel de surveillance épidémiologique ne les ait enregistrées. Ce principe a déjà été utilisé par Google à partir des requêtes d’internautes en l’appliquant aux épidémies de grippe. Cette fois, une équipe de chercheurs du Laboratoire national de Los Alamos (Nouveau Mexique) démontre la validité de ce concept en s’appuyant sur les pages vues sur Wikipedia.

Dans un article publié jeudi 13 novembre par la revue en ligne PLoS Computational Biology, l’équipe de Sara Del Valle précise avoir ainsi surveillé des épidémies de grippe aux Etats-Unis, en Pologne, au Japon et en Thaïlande, des flambées de dengue au Brésil et en Thaïlande, ainsi que des épidémies de tuberculose en Thaïlande et en Chine, soit huit épisodes. Hormis le cas de la tuberculose, l’équipe américaine a même prédit les autres phénomènes épidémiques avec une avance allant jusqu’à 28 jours par rapport au système de surveillance classique.

Système de détection

Les maladies infectieuses constituent une menace sérieuse pour la santé publique, la stabilité économique et les structures sociales. L’épidémie de fièvre Ebola en Afrique de l’Ouest en constitue une illustration flagrante. Mais les auteurs rappellent également qu’aux Etats-Unis, selon les années, la grippe est à l’origine de 3000 à 49 000 décès, sans compter des pertes économiques annuelles évaluées à 87 miliards de dollars (70 milliards d’euros).

Prévenir et contenir la propagation d’une épidémie suppose la mise en place d’un système de surveillance capable de la détecter, de la caractériser et de quantifier la fréquence de survenue de nouveaux cas. Le système en vigueur s’appuie sur les consultations de patients chez le médecin ou à l’hôpital, les examens de laboratoire et les diagnostics, et la notification aux structures de veille sanitaire. Ils sont complétés par les données sur l’absentéisme à l’école ou au travail, les appels et les hospitalisations dans les services d’urgences. En France existe ainsi le réseau Sentinelle, regroupant plus de 1300 médecins généralistes, et le réseau Oscour (Organisation de la surveilance coordonnée des urgences) rassemblant près de 600 unités d’urgences.

Coût et délais

Ce type de dispositif est considéré comme fiable, mais il a deux faiblesses : son coût et le délai entre le moment où un cas est observé et celui où il est notifié. c’est ce qui a motivé la recherche de moyens complémentaires reposant essentiellement sur l’analyse du gisement de données d’internet : moteurs de recherche, sites et réseaux sociaux. Cela suppose de confronter le modèle informatique mis au point pour estimer le phénomène épidémique à la réalité telle que la surveillance traditionnelle le restitue.

Expérimenté lors de la pandémie de 2009, Google Flu Trends (Google tendances grippales) avait montré une capacité de suivi de la propagation du virus de la grippe tout à fait cohérente avec les données qu’avaient enregistrés les Centres de contrôle et de prévention des maladies américains (CDC). Ironie de l’histoire, le New York Times du 10 novembre indiquait que les dirigeants de Google lançaient un nouveau modèle de Flu Trends aux Etat-Unis, dont la nouveauté destinée à en améliorer la précision, consiste à intégrer les données des CDC.

Sept maladies et neuf pays

Sara Del Valle et ses collaborateurs ont choisi de s’appuyer sur l’analyse des données ouvertes de l’encyclopédie collaborative en ligne Wikipedia (ce qui n’est pas le cas des données de Google) et ses quelque 30 millions d’articles publiés en 287 langues. Des mots clés ont été déterminés pour chaque maladie et la langue a été utilisée comme comme outil de localisation géographique. Sept maladies et neuf pays ont été choisis : grippe (Japon, Pologne, Thaïlande, Etats-Unis), dengue (Brésil, Thaïlande), choléra (Haïti), VIH/sida (Chine, Japon), Ebola (Ouganda), tuberculose (Chine, Thaïlande, Norvège), peste (Etats-Unis).

Soit au total 14 contextes maladie-lieu. Pour huit de ces contextes, le modèle a fourni une estimation proche des données de la surveillance officielle. Les auteurs de l’article soulignent que ces huit épidémies ont non seulement été suivies avec succès au moment où elles se déroulaient, mais ont même été prévues avec une avance allant jusqu’à 28 jours dans les cas de la grippe et de la dengue.

Sara Del Valle et ses collègues reconnaissent que leur modèle devra être mis à l’épreuve dans d’autres contextes que ceux étudiés, et, notamment, en améliorant la procédure de sélection des articles de Wikipedia et celle de géolocalisation. Néanmoins, ils estiment qu’il apporte de sérieux arguments pour penser que Wikipedia constitue une source de données très utile pour la surveillance des maladies.

 

 

L’espace des contributions est réservé aux abonnés.
Abonnez-vous pour accéder à cet espace d’échange et contribuer à la discussion.
S’abonner

Voir les contributions

Réutiliser ce contenu

Lecture du Monde en cours sur un autre appareil.

Vous pouvez lire Le Monde sur un seul appareil à la fois

Ce message s’affichera sur l’autre appareil.

  • Parce qu’une autre personne (ou vous) est en train de lire Le Monde avec ce compte sur un autre appareil.

    Vous ne pouvez lire Le Monde que sur un seul appareil à la fois (ordinateur, téléphone ou tablette).

  • Comment ne plus voir ce message ?

    En cliquant sur «  » et en vous assurant que vous êtes la seule personne à consulter Le Monde avec ce compte.

  • Que se passera-t-il si vous continuez à lire ici ?

    Ce message s’affichera sur l’autre appareil. Ce dernier restera connecté avec ce compte.

  • Y a-t-il d’autres limites ?

    Non. Vous pouvez vous connecter avec votre compte sur autant d’appareils que vous le souhaitez, mais en les utilisant à des moments différents.

  • Vous ignorez qui est l’autre personne ?

    Nous vous conseillons de modifier votre mot de passe.

Lecture restreinte

Votre abonnement n’autorise pas la lecture de cet article

Pour plus d’informations, merci de contacter notre service commercial.