Contribution utile à la compréhension des infections à
Salmonella, voici, «Comprendre les infections à Salmonella en Floride», source Université de Floride (UF).Une nouvelle étude menée par des chercheurs de l'UF sur les infections à Salmonella en Floride a mis en évidence l'influence des saisons, de la géographie et de l'âge sur les modes de transmission. L'équipe a également développé de nouvelles méthodes basées sur l'IA pour détecter les épidémies et relier les cas à des sources environnementales ou alimentaires.
Si vous êtes déjà tombé malade d'une salmonellose d'origine alimentaire, vous n'oublierez pas de sitôt les jours de détresse gastro-intestinale - douleurs abdominales, diarrhée et vomissements - plus fièvre et frissons. Malheureusement, les Floridiens supportent une part injuste de cette maladie, connaissant deux fois le taux par habitant du pays, selon une nouvelle étude.
Des chercheurs de l’Institute of Food and Agricultural Sciences (IFAS), du Food Systems Institute et de l'Emerging Pathogens Institute (EPI) de l'UF ont récemment publié deux articles qui proposent l’analyse la plus détaillée à ce jour de la salmonellose en Floride. Le travail était une collaboration avec le Florida Department of Health (FDOH) dans le cadre des Centers of Excellence in Food Safety qui sont financés par le Centers for Disease Control and Prevention des États-Unis.
Dans un article, les chercheurs ont analysé les données collectées par le FDOH pour déterminer les tendances géographiques, démographiques et temporelles des cas et des épidémies au cours de la dernière décennie. Dans le deuxième article, ils ont analysé l'épidémiologie moléculaire des cas en 2017 et 2018 pour comparer la diversité et l'abondance des différents types de Salmonella connus en Floride avec ceux connus au niveau national. Ils ont également développé de nouvelles méthodes pour détecter rapidement les épidémies, les clusters de cas qui surviennent sur une période plus longue ou même les expositions courantes provenant de la nourriture, des animaux ou d'autres réservoirs.
La salmonellose est causée par la bactérie Salmonella, qui comprend environ 2 600 sérotypes différents. Un sérotype fait référence à un ensemble unique d'antigènes de surface sur un micro-organisme, et c'est une façon de regrouper les agents pathogènes dans des catégories plus petites que les espèces. Divers sérotypes de Salmonella sont associés à des aliments spécifiques ou à d'autres sources et peuvent être utilisés pour démontrer les liens entre les cas individuels, détecter les épidémies et même relier les épidémies aux sources.
«L'État enregistre tellement de cas qu'il ne peut effectuer le séquençage du génome entier que pour certains des prélèvements», déclare l'auteur de l'étude Nitya Singh, chercheur à l'IFAS et à l'EPI. «Ce que nous avons fait, c'est analyser leurs données pour mieux comprendre comment ces données pourraient éclairer l'action de santé publique.»
Âge, saisons et régions
L'étude a révélé que les enfants de moins de cinq ans sont infectés plus fréquemment que tout autre groupe d'âge; ils représentent 40,9% des quelque 63 000 cas d'infection à Salmonella signalés dans l’État entre 2009 et 2018. Bien que les chercheurs n’aient pas étudié les raisons de cette différence fondée sur l’âge, Singh affirme qu’il s’agit d’une constatation courante dans le monde entier.
Ils ont également constaté que les cas de salmonellose atteignaient un pic chaque année en Floride entre août et octobre. Singh dit que cela pourrait être lié au climat: ces mois ont tendance à être caractérisés par des températures moyennes et des précipitations élevées. Le calendrier correspond également à la fin de la saison des ouragans, et d'autres recherches relient les pics de maladies d'origine alimentaire à des événements météorologiques extrêmes.
Au fil du temps, les chercheurs ont détecté une légère diminution du taux de salmonellose: de 2009 à 2016, il a baissé de 23% avant de remonter à nouveau. Les régions du nord-est et du nord-ouest de la Floride ont également connu des taux plus élevés de salmonellose au cours des années examinées, voir la figure ci-dessous, bien que les raisons restent incertaines.
|
Le taux d'incidence de la salmonellose par comté de Floride en 2017 et 2018 (figure fournie par les auteurs de l'étude). |
Épidémiologie moléculaireLes chercheurs ont analysé les données de l’État et ont trouvé peu de différence entre les sérotypes infectant les jeunes enfants et tous les autres groupes d’âge. Mais ils ont trouvé de grandes différences entre les sérotypes communs à l'échelle nationale et ceux communs au Sunshine State (Floride), comme le montre le graphique ci-dessous.
|
Prévalence des sérotypes de Salmonella retrouvés en Floride et à l'échelle nationale. (Figure fournie par les auteurs de l'étude) |
La principale différence en Floride est une prévalence élevée du sérotype Sandiego qui est presque inexistante à l'échelle nationale. Un sérotype nommé Braenderup est également plus important en Floride que dans l'ensemble des États-Unis. Mais les deux premiers sérotypes trouvés en Floride, Enteritidis et Newport, correspondent aux deux premiers à l'échelle nationale.
Étant donné que la Floride enregistre autant de cas à Salmonella chaque année, il n'est pas rentable pour le département de la santé d'effectuer un séquençage génétique dans chaque cas. Mais les auteurs de l'étude ont déterminé que les séquences obtenues par l'État sont probablement très représentatives de tous les cas de Salmonella qui surviennent dans la population générale.
Une nouvelle façon de détecter les épidémies
Divers outils moléculaires aident les chercheurs à étudier la génétique d’un organisme. Un outil qui passe au crible environ 5 millions de paires de bases d'ADN jusqu'à environ sept chiffres clés est le typage par séquençage MLST. Mais bien qu'utile pour identifier les sérotypes de Salmonella, sa résolution est trop grossière pour être comparée si plusieurs isolats sont génétiquement liés, comme cela se produirait en situation d'épidémie.
En d'autres termes, la méthode MLST déterminera si un échantillon est du sérotype Sandiego, mais pas si deux isolats Sandiego distincts sont génétiquement suffisamment proches pour provenir de la même source. Pour ce niveau de détail, de nombreux chercheurs se tournent vers des méthodes basées sur le polymorphisme d'un seul nucléotide, ou analyses SNP, qui identifient des changements uniques dans les paires de bases d'ADN. Mais les travaux basés sur les SNP sont trop longs et trop gourmands en ressources pour être utilisés pour les milliers d'isolats de Salmonella séquencés chaque année en Floride.
«Le but de la détection d'une épidémie est de déterminer quels cas partagent une relation génétique étroite, et de comprendre cela rapidement», dit Singh. «Nous avons dû repenser la manière de procéder. Nous avions besoin d'un outil de résolution fine pour rechercher rapidement les liens génétiques entre les cas et détecter les flambées. Mais les méthodes basées sur SNP sont trop lentes, nos ordinateurs fonctionneraient pendant des mois.»
Le défi: comment analyser des téraoctets de données et découvrir des connexions génétiques en moins de temps?
«Nous devions rétrécir nos filets de pêche», dit Singh. «Trouver des liens génétiques est la preuve ultime que les cas sont liés, et avec notre méthode, vous ne pouvez pas le manquer.»
Tout d'abord, l'équipe a d'abord utilisé une méthode MLST avancée qui ne regarde que les gènes conservés dans le génome central, pour rechercher rapidement des liens entre des milliers d'isolats et les saisir. Deuxièmement, à l'aide d'un algorithme d'apprentissage automatique basé sur l'IA appelé clustering hiérarchique, l'équipe a analysé les données de séquençage de l'état pour regrouper les isolats de Salmonella partageant la caractéristique commune de variations identiques dans jusqu'à cinq allèles, qui sont des variations d'un seul gène qui se produisent dans le même endroit sur un chromosome. Cette approche est au cœur de la nouvelle méthode en deux étapes proposée par les chercheurs.
«Le séquençage du génome entier a permis d'obtenir et d'utiliser des données de séquence à partir de l'ensemble du génome», a dit le co-auteur Arie Havelaar. «Cela offre bien sûr un niveau de résolution beaucoup plus élevé, mais cela ajoute également à la complexité.» Havelaar est professeur à l'UF en évaluation des risques microbiens et épidémiologie des maladies d’origine alimentaire, et il a été embauché dans le cadre de l’initiative de prééminence d’UF. Il est reconnu comme un expert international de la sécurité des aliments.
Le regroupement hiérarchique basé sur l'IA permet aux chercheurs d'affiner leur recherche dans le génome d'un isolat d'environ 5 millions de points de données à environ 3 000. Il compare ensuite ces données de séquence tamisées et utilise l'apprentissage automatique pour identifier les relations génétiques. Enfin, les chercheurs ont ensuite utilisé la phylogénie basée sur le SNP pour explorer davantage la parenté génétique au niveau des paires de bases individuelles et pour valider l'approche de clustering.
Lier les cas aux sources
Les auteurs de l'étude disent que leur nouvelle approche en deux étapes a des utilisations différentes.
«Il peut identifier d'éventuelles épidémies dans la fenêtre de temps traditionnelle de 60 jours. Mais nous avons également utilisé la méthode pour détecter des séries groupées de cas survenant sur des périodes beaucoup plus longues, jusqu'à 18 mois. Et nous avons cherché à identifier les sources possibles de ces épidémies et clusters de cas», dit Singh.
Pour identifier les sources possibles, l'équipe a pris l'étape supplémentaire de relier rétroactivement les cas de clusters de patients de Salmonella Enteritidis en Floride avec des échantillons obtenus à partir d'aliments et de l'environnement en utilisant la même approche en deux étapes.
«La plupart du temps, les cas sont liés à la viande de poulet», dit Singh. Ces isolats de viande de poulet provenaient de Floride, mais aussi de nombreux autres États, ce qui suggère des problèmes persistants dans la chaîne d'approvisionnement en viande de volaille qui causent à plusieurs reprises des maladies humaines.
Havelaar dit que le nouveau travail souligne l'efficacité de l'approche combinée, qui peut être entreprise par n'importe quel laboratoire en utilisant des données de génome et de séquençage accessibles au public.
«Un défi dans les efforts actuels de suivi des sources est que les données génétiques sur les isolats de Salmonella provenant de différentes sources sont limitées», dit-il. «Les données sur le poulet et d'autres viandes sont régulièrement générées par le Food safety Inspection Service de l'USDA, mais beaucoup moins de données sont disponibles sur d'autres aliments. Si nous devions systématiquement rechercher Salmonella dans plus de sources possibles, nous améliorerions considérablement notre capacité à relier rapidement les cas humains aux sources. »