Surveillance des maladies à norovirus à l’aide de données de partage de requêtes sur Internet Google

Les données IQS de partage d’interrogation Google Internet pour les termes de recherche liés à la gastro-entérite étaient fortement corrélées avec les données nationales contemporaines R2 = 070 et régionales R2 = 074 norovirussurveillance aux États-Unis. Les données IQS peuvent faciliter l’identification rapide du début de la saison des norovirus, l’activité maximale nouvelles souches

Le norovirus est la principale cause de gastro-entérite aux États-Unis, contribuant à environ 21 millions de maladies par an, la majorité se produisant pendant les mois d’hiver [1, 2] Malheureusement, les données de surveillance norovirus sont disponibles aux États-Unis. parce que le moment et l’ampleur de l’activité des norovirus peuvent varier d’une année à l’autre [4, 5], un outil de surveillance opportun, accessible au public et économique peut Google Insights for Search permet aux utilisateurs de suivre facilement les requêtes de recherche sur Internet sur des intervalles de temps et des régions géographiques spécifiques [6, 7] La ​​surveillance de la santé publique sur Internet est une nouvelle approche qui peut être réalisée à l’aide de termes syndromiques et spécifiques à une maladie [8] Pour évaluer si Internet Nous avons comparé les QI des partages de requêtes Internet pour les termes de recherche syndromique liés à la gastro-entérite avec les données de surveillance des maladies norovirales aux États-Unis. Bien que ces sources de données puissent ne pas saisir complètement le fardeau de la norovirose, elles conviennent analyse de série et opportunité

Méthodes

Les sources de données

Les données de surveillance des épidémies étaient basées sur les rapports mensuels d’épidémies de norovirus suspectées et confirmées survenues entre le 1er janvier 2007 et le 30 avril 2010 dans 30 états américains [5]. les rejets hospitaliers de tous âges ont été estimés à partir de modèles de régression chronologique construits à partir d’hospitalisations associées à une gastroentérite toutes causes confondues entre le 1er janvier 2004 et le 30 juin 2007 [9] Données de surveillance syndromique prospective sur l’ensemble des urgences Boston Public Health Commission BPHC pour la période du 1er janvier 2006 au 2 juillet 2011 Le système de surveillance syndromique de Boston reçoit des informations quotidiennes sur tous les services d’urgence hospitaliers de Boston n = 10 visites, avec des informations sur la date de visite , facilité d’identification Les épidémiologistes de la BPHC utilisent le Système de signalement précoce des aberrations pour catégoriser les principales plaintes en syndromes personnalisables. Le syndrome des maladies gastro-intestinales aiguës est défini comme «non chronique». diarrhée ou des vomissements dans la plainte principale ou une maladie entérique intoxication alimentaire, salmonelle « Google stocke des informations sur toutes les requêtes de recherche effectuées en utilisant le moteur de recherche Google [6] Ces données sont utilisées pour calculer un IQS, qui est le nombre de requêtes de recherche pour le durée d’intérêt dans une période donnée et une région géographique, divisé par le nombre total de requêtes de la même période et les données IQS de la région sont mises à l’échelle, ce qui signifie que les données hebdomadaires sont exprimées en pourcentage du partage de requêtes de pointe en une fois période Les valeurs de partage de requête mises à l’échelle sont tracées au fil du temps, générant une série temporelle. La définition IQS liée au norovirus a été initialement créée à l’aide du suivi ng 10 termes de recherche pour norovirus: norovirus, vomissements, diarrhée, nausée, douleur abdominale, virus de l’estomac, intoxication alimentaire, gastro-entérite, virus Norwalk et rotavirus Chaque terme a été regroupé séparément avec tous les autres termes de recherche fortement corrélés. chaque groupe a été évalué avec et sans filtre qui inclut uniquement les recherches liées à la catégorie «Gastro-œsophagien Reflux Disease and Digestive Disorders GERD» La définition IQS avec la plus forte corrélation avec les données de surveillance des éclosions de norovirus aux États-Unis a été sélectionnée

L’analyse des données

Des données IQS mensuelles ont été générées pour 30 états américains pour lesquels des données épidémiologiques étaient disponibles et pour l’ensemble de la population américaine du 1er janvier 2004 au 30 avril 2010 Les données IQS des norovirus pour 30 États américains ont été comparées aux données de surveillance des épidémies de norovirus du 1er janvier 2007 à 30 Les données IQS de norovirus pour l’ensemble de la population américaine ont été comparées aux estimations des rejets hospitaliers associés aux norovirus entre le 1er janvier 2004 et le 30 juin 2007. Nous avons défini l’année saisonnière du norovirus comme allant du 1er mai au 30 avril de l’année suivante. pics saisonniers hivernaux Les mois ayant le plus haut niveau d’activité saisonnière ont été identifiés pour chaque saison de norovirus et les coefficients de corrélation de Pearson ont été calculés Au niveau local, nous avons obtenu des données hebdomadaires IQS pour la population métropolitaine de Boston du 1er janvier 2006 au 2 juillet 2011 Les coefficients entre les données de surveillance du BPHC et les données IQS ont été calculés pour une plage de ± 26 semaines de plomb et de temps ag, et le temps d’avance ou de retard qui a maximisé le coefficient de corrélation a été identifié

RÉSULTATS

Entre le 1er Janvier 2007 et le 1er mai 2010, le groupe de termes de recherche syndromiques norovirus avec de partager des données de requêtes qui ont la plus forte corrélation R2 = 095 avec les données de surveillance des États-Unis d’épidémie norovirus inclus: « virus de l’estomac », « grippe intestinale », « maladie de l’estomac, » « bug de l’estomac », « maladie de l’estomac » et « l’estomac malade, » à l’aide d’un filtre de GERD Tableau supplémentaire comparativement aux données de surveillance des États-Unis d’épidémie norovirus, les données IQS avaient le même mois de pointe en 2 saisons Janvier en 2007-2008 et Février dans 2009-2010 Pendant la saison 2008-2009, les données IQS ont atteint un sommet en Décembre, alors que les données de surveillance des épidémies aux États-Unis ont atteint un sommet en Janvier entre le 1er Janvier 2004 et le 1er mai 2007, la corrélation entre les données IQS et les rejets hospitaliers associés norovirus estimés était modérément forte R2 = 070 En comparaison avec les estimations des rejets hospitaliers associés aux norovirus, les données d’IQS ont connu le même mois de pointe en 2 saisons janvier 2004-2005 et janvier 2006-2007 Dans les mers 2005-2006 les données IQS ont atteint un sommet en décembre, tandis que les estimations des rejets hospitaliers associés aux norovirus ont atteint un sommet en mars.

Les données IQS bleues pour l’ensemble de la population américaine ont été comparées aux données sur les rejets hospitaliers estimés associés aux norovirus rouges du 1er janvier 2004 au 30 juin 2007 données de surveillance rouges du 1er janvier 2007 au 30 avril 2010 Figure 1Voir grandTélécharger slideA Partage de requêtes Internet Norovirus Les données IQS bleues pour l’ensemble de la population américaine ont été comparées aux données sur les rejets hospitaliers estimés associés aux norovirus rouges du 1er janvier 2004 au 30 juin 2007 B Données Norovirus IQS comparé aux données de surveillance des épidémies de norovirus entre le 1er janvier 2007 et le 30 avril 2010 À Boston entre le 1er janvier 2006 et le 2 juillet 2011, la corrélation était la plus forte R2 = 074 entre les données IQS 2 semaines avant la surveillance des urgences Données IQS de la semainex-2 par rapport aux données de surveillance des services d’urgence des norovirus à partir de weekx Figure 2

Figure 2View largeDownload slideNorovirus Internet requête partager des données bleues pour Boston par rapport à la proportion de maladies dans le système de surveillance syndromique de la Commission de santé publique de Boston pour les maladies gastro-intestinales rouge du 1er janvier 2006 au 2 juillet 2011 la proportion de maladies dans le Système de surveillance syndromique de la Commission de santé publique de Boston pour les maladies gastro-intestinales rouge du 1er janvier 2006 au 2 juillet 2011

DISCUSSION

Les données IQS américaines pour le norovirus sont fortement corrélées avec 2 indicateurs de l’activité nationale des norovirus et au niveau métropolitain à Boston Cela suggère un rôle unique pour cet outil de surveillance en temps opportun à différents niveaux de santé publique. En tant que source de données mondiale automatisée et en temps réel, les données IQS peuvent fournir une indication précoce de l’augmentation de la norovirose, qui peut guider les protocoles cliniques et diagnostiques locaux. L’interprétation des données IQS est entravée par des motifs de recherche d’utilisateurs inconnus, reflétant peut-être à la fois la maladie active et l’intérêt général des médias pour la santé. La maladie de norovirus Il est intéressant de noter que dans une étude suédoise, un rapport de presse s Il n’y a pas de corrélation avec les demandes de recherche ou les cas de norovirus confirmés en laboratoire. [10] Une autre préoccupation est le risque de propagation d’une autre maladie causant une maladie similaire dans les schémas de recherche. Heureusement, comme la norovirus est la cause la plus fréquente de maladie gastro-intestinale aux États-Unis, les données IQS sont bien corrélées avec les données nationales de surveillance des norovirus. De plus, tout grand événement national ou local augmente ou diminue le nombre d’Internet. Enfin, cette approche peut ne pas bien fonctionner chez les petites populations ayant un accès Internet limité. Dans cette analyse, les données IQS ont été comparées à trois sources de données, chacune avec ses propres limites. Les données sur les épidémies de norovirus reposaient sur sur les pratiques volontaires de déclaration des organismes de santé publique locaux et étatiques, qui varient Les données sur les sorties hospitalières associées aux norovirus ont été modélisées à l’aide de données saisonnières sur les causes de gastro-entérite non spécifiées plutôt que sur les épisodes de norovirus confirmés en laboratoire. La saison 2005-2006 présentait un fardeau de rotavirus élevé, causant les infections associées aux norovirus. les données de sortie de l’hôpital ont un comportement erratique; Heureusement, la réduction du fardeau de la maladie à rotavirus à l’ère post-vaccin conjuguée à un système national efficace de surveillance du rotavirus peut aider à distinguer ces étiologies les unes des autres. Bien que les données du BPHC ne soient pas spécifiques aux norovirus , ils fournissent des données intéressantes sur les tendances syndromiques aux cliniciens locaux et aux cliniciens locaux. Une association optimale entre les données IQS et BPHC a eu lieu avec un délai de deux semaines, suggérant que les recherches sur Internet pour le norovirus peuvent survenir avant les visites aux urgences pour gastro-entérite. une association temporelle ne peut pas être évaluée car les données IQS ne fournissent pas d’informations individuelles. Les données de recherche basées sur Internet sont prometteuses dans les contextes où les données de surveillance traditionnelles sont limitées, absentes ou manquent simplement de rapidité, mais l’accès à Internet est très répandu. diffuser des informations sur la maladie De plus, cette approche a été utilisée avec succès pour d’autres maladies infectieuses, y compris la grippe et les rotavirus [8, 11] À mesure que de nouveaux systèmes nationaux de surveillance des éclosions de norovirus aux États-Unis se sont établis [1]. ], des données supplémentaires seront disponibles pour évaluer les données IQS en complément de la surveillance traditionnelle

Remarques

Remerciements Les auteurs remercient Julia Gunn de la Boston Public Health Commission à Boston, Massachusetts pour son aide dans l’obtention de données locales sur la santé publique et son examen critique du manuscrit. Avertissement Les conclusions et conclusions de ce rapport sont celles des auteurs et ne représentent pas nécessairement le vues des centres de contrôle et de prévention des maladies Conflits d’intérêts potentiels Trois coauteurs, YS, NE et YM, travaillent chez Google Incorporated Aucune compensation n’a été accordée aux personnes susmentionnées ou à Google Incorporated Aucun organisme de financement ou sponsor n’a eu de rôle dans la conception et conduite de l’étude; la collecte, la gestion, l’analyse et l’interprétation des données; et la préparation, l’examen ou l’approbation du manuscrit RD a eu un accès complet à toutes les données de l’étude et assume la responsabilité de l’intégrité des données et de l’exactitude de l’analyse des données Tous les autres auteurs signalent aucun conflit potentiel Tous les auteurs ont soumis le formulaire ICMJE pour Divulgation des conflits d’intérêts potentiels Les conflits que les éditeurs jugent pertinents pour le contenu du manuscrit ont été divulgués