一种新颖的机器学习方法可以更快地识别某些动物的来源 沙门氏菌 爆发。佐治亚州格里芬市佐治亚大学食品安全中心的研究人员带领的科学家在2019年1月的《科学》杂志上发表了有关其方法的研究。 新兴传染病.
该中心食品微生物学助理教授邓向宇说:“在一次食源性疾病暴发中,必须迅速识别所涉及的食品,以及时召回受污染的产品,以防止更多的消费者感染病原体。”项目。肉类和其他畜产品是 沙门氏菌 感染。
邓博士的方法论涉及使用来源归因工具,该工具可利用大量且不断增长的 全基因组测序 (WGS)数据中最普遍的一种 沙门氏菌 血清型。他使用了1,000多个基因组来预测动物的来源 沙门氏菌 鼠伤寒
“我们训练了一种称为随机森林的机器学习算法,其中有很多 沙门氏菌 源自家畜的鼠伤寒基因组。该算法学习了如何分类 沙门氏菌 鼠伤寒基因组与家畜的联系“然后,我们可以使用该算法预测查询基因组的动物来源,它们可能是暴发菌。”
通过使用机器学习方法,邓博士的团队确定了大约50个遗传标记的一小部分,这些遗传标记足以可靠地预测病原体的家畜来源。他说:“这一发现可能会导致快速而可扩展的来源识别工具,而无需分析整个基因组。”
在评论这种新方法时,爱荷华州立大学艾姆斯分校微生物学动物科学系动物科学系教授James S. Dickson博士说:“全基因组测序是一种非常强大的工具,但它非常费力深入分析结果。使用计算机算法从暴发中的患者中识别出相似的文化,公共卫生流行病学家就可以更快地开始追踪病源。这样可以更快地确定爆发的来源。”
Dickson博士认为,新方法是使用WGS的合乎逻辑的下一步。他说:“因为存在大量数据,所以使用计算机算法对数据进行排序很有意义,并且可以更快地分析数据。” “关键是要确保计算机知道要在数据中查找的内容,这是乔治亚大学的科学家正在研究的内容。如果他们能够解决告诉计算机要寻找什么和忽略什么的所有细节,那么这可能是公共卫生领域的重要一步。该技术将不仅限于食源性疾病,还可以适用于其他类型的人类疾病。”
尽管有津贴,邓博士指出这种方法有一些局限性。他说:“我们只研究一种血清型。”虽然在世界许多地方,鼠伤寒通常是最常见的血清型,但据报道有超过2600种不同的血清型 沙门氏菌 存在。
其次,邓博士的团队迄今仅探索了几种主要的牲畜资源,包括家禽,牛和猪。此外,一些 沙门氏菌 菌株是寄主偏爱的通才。它们可以在不同的动物之间跳来跳去,使来源归因具有挑战性。
Dickson博士说:“与大多数创新一样,概念验证与应用之间的距离差异很大。我认为他们将需要扩大方法,并包括国际贸易伙伴。”
发表评论