机器学习模型助力探寻新冠病毒新变种
《参考消息》29日登载阿根廷布宜诺斯艾利斯经济新闻网报道。报道摘要如下:
麻省理工学院-哈佛大学布罗德研究所以及美国马萨诸塞大学医学院的科学家开发了一种机器学习模型,可以分析来自新冠病毒样本的数百万个基因组,并预测哪些病毒变体将占主导地位并可能引发新的浪潮。该模型被称为PyR0,可以帮助研究人员确定病毒基因组的哪些部分最不可能发生突变,从而为可对抗未来变体的疫苗提供目标。研究结果日前发表在美国《科学》周刊上。
研究人员使用截至2022年1月在流感数据共享全球倡议数据库中的600万个新冠病毒基因组训练了机器学习模型。
自新冠大流行开始以来,世界各地的研究人员一直致力于预测新冠病毒不同变体的适应性。但以前的模型无法同时比较所有变体,或者仅处理几千个基因组就需要数天时间。
相反,PyR0可以在大约1小时内分析数百万个基因组——所有公开可用的新冠病毒数据。它将相似的序列组合在一起,并通过它们共享的突变群来定义基因组的“组别”。通过聚焦可能出现在多个变体中的突变,PyR0比仅关注病毒变体的模型具有更强大的统计能力。
随后,该模型可以确定哪些突变将越来越普遍,并估计每种突变导致病毒传播的速度。它还可根据其基因组成估计不同变体的病例数量增加的速度。
通过确定哪些突变对哪些变体的适应性很重要,该模型还提供了关于新冠病毒如何传播和发展的生物学观点。例如,了解关键突变可以帮助科学家预测新变体是否更具传染性或更能逃避中和抗体,还可以帮助他们决定要更详细地研究哪些突变。