Détecter l’émergence de la prochaine maladie X

Science en action 20 juillet 2020
L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne de données, ces signaux faibles n’ont cependant pas su être interprétés à temps. Une équipe de chercheurs du Cirad, dans un article publié le 20 juillet dans Transboundary and Emerging Diseases, revient sur le vocabulaire utilisé en ligne pour décrire cette nouvelle maladie. Ces recherches, menées dans le cadre du projet européen MOOD, serviront à améliorer les systèmes de détection de la prochaine maladie X.
Plus de 60 % des nouvelles maladies infectieuses émergent de l'animal. © PY Le Gal, Cirad
Plus de 60 % des nouvelles maladies infectieuses émergent de l'animal. © PY Le Gal, Cirad

Plus de 60 % des nouvelles maladies infectieuses émergent de l'animal. © PY Le Gal, Cirad

Le 31 décembre 2019, les agents de santé de la province de Wuhan, en Chine, rapportent pour la première fois un cluster de 27 cas d’une « pneumonie de cause inconnue ». Le même jour, PADI-Web et HealthMap repèrent plusieurs articles en ligne relatant une « maladie mystère ». ProMed, quant à lui, avait repéré ce même vocabulaire dans les médias en ligne un jour avant la notification officielle de la Chine.

Ces trois systèmes d’intelligence artificielle sont appelés « EBS », Event-Based Surveillance. Tous les jours, ils passent en revue des centaines de milliers d’articles parus en ligne, afin de suivre l’émergence ou la propagation de certaines maladies. Mathieu Roche, l’un des auteurs de l’article paru dans Transboundary and Emerging Diseases , compare son travail de fouilleur de données à celui d’un orpailleur : « Nous fouillons parmi des quantités de données considérables, donc il faut être capable de trier efficacement entre l’information utile et l’information inutile. Nos systèmes de surveillance fonctionnent comme un tamis qui chercherait de l’or parmi les grains de poussière. Notre objectif est de mettre à jour les pépites, qui sont finalement des signaux faibles d’évolution d’une maladie ».

Un vocabulaire autour du « mystère » et de la « pneumonie »

Certaines veilles se concentrent sur des maladies déjà connues, comme Ebola ou la peste porcine africaine. En revanche, pour les maladies nouvelles, les chercheurs utilisent une « veille syndromique ». « Il ne s’agit plus de cibler une maladie en particulier, explique Mathieu Roche. On va plutôt chercher des mots-clés liés à des symptômes, à des phénomènes mystérieux ou des sentiments d’inquiétude ».

Pour le Covid-19, les travaux pluridisciplinaires des équipes de Mathieu Roche et de Renaud Lancelot ont mis au jour un vocabulaire autour du « mystère » et de la « pneumonie » lors de la phase d’émergence de la maladie. « Avant que le virus ne soit formellement identifié, on trouve des articles qui parlent de « maladie mystère » ou de « pneumonie de cause inconnue » , indique le chercheur. Ensuite, à partir du moment où les médecins s’emparent du sujet, le vocabulaire devient plus technique ».

« Mieux connaître le vocabulaire utilisé selon les phases d’évolution de la maladie nous permet d’améliorer nos systèmes de veille , souligne Mathieu Roche. Plus on est capable de repérer un vocabulaire spécifique, plus l’identification devient précise. C’est comme si on affinait les mailles du tamis. »

Grâce à cette analyse rétrospective, les chercheurs espèrent produire des systèmes de veille encore plus performants à l’avenir.

Ces travaux de recherche se déroulent dans le cadre du projet européen MOOD, qui vise à harmoniser la veille sanitaire européenne. MOOD se sert de « maladies modèles » (voir encadré ci-dessous), classées selon leurs modes de transmission. Le Covid-19 sert actuellement de modèle d’étude pour la surveillance des maladies encore inconnues, appelées X.

Les maladies surveillées par le projet européen MOOD

• La COVID-19 comme modèle pour les agents pathogènes inconnus (maladie X), qui constituent un défi pour tout système de surveillance des épidémies ;
• La grippe (tous types de virus) pour les agents pathogènes transmis par l'air ;
• L'encéphalite à tiques et la borréliose de Lyme comme modèles d'agents pathogènes endémiques transmis par des vecteurs endémiques ;
• Les virus du Nil occidental et Usutu comme exemples de pathogènes exotiques transmis par des vecteurs endémiques ;
• Les virus du Chikungunya, de la dengue et du Zika comme modèles d'agents pathogènes exotiques transmis par des espèces de moustiques envahissantes ;
• La tularémie et la leptospirose comme modèles d'agents pathogènes endémiques négligés ayant de multiples voies de transmission et réservoirs ;
• Les souches bactériennes résistantes aux antimicrobiens en tant que modèles de menaces de maladies complexes et anthropogènes.

Référence

Sarah Valentin, Alizé Mercier, Renaud Lancelot, Mathieu Roche, Elena Arsevska. Monitoring online media reports for the early detection of unknown diseases: insights from a retrospective study of COVID-19 emergence.