Cell | 人工智能发现超长RNA病毒

文摘   2024-10-15 23:49   日本  

想象一下,我们生活的世界就像一本厚厚的百科全书。但是,你知道吗?我们可能只读懂了其中的一小部分!


在微观世界里,有着数不清的"隐形"生命——RNA病毒。它们虽然小得肉眼看不见,却可能在地球生态系统中扮演着重要角色。就像藏在树叶背面的小精灵,它们一直存在,却难以被发现。直到现在,科学家们借助人工智能这个"魔法放大镜",终于揭开了这个神秘世界的面纱。他们发现,RNA病毒的世界比我们想象的要丰富得多、复杂得多!

2024年9月19日,来自中山大学和阿里云等研究团队 Cell 期刊在线发表了一篇题为《利用人工智能揭示隐藏的RNA病毒世界》的研究论文。科学家利用深度学习技术发现了大量新的RNA病毒,揭示了自然界中存在着比我们想象更加丰富和多样的RNA病毒生态系统。


研究团队开发了一种名为"LucaProt"的深度学习算法,该算法不仅能分析蛋白质序列,还能识别蛋白质结构信息。他们利用这一工具分析了来自全球各种生态系统的10,487个宏转录组数据集,并将结果与传统的基于序列同源性的方法进行了比较。为了验证发现的可靠性,研究人员还进行了DNA和RNA测序实验,并使用RT-PCR技术进行了进一步确认。




惊人的病毒多样性




研究团队发现了161,979个可能的RNA病毒物种,它们可以被分为180个超级组(相当于现有病毒分类系统中的纲或门)。这一发现使已知的RNA病毒多样性增加了55.9倍,相比国际病毒分类委员会(ICTV)定义的4,502种病毒,增长了近56倍。特别值得注意的是,研究发现了60个此前未被关注的高度多样化的病毒组,大大扩展了我们对RNA病毒世界的认知。其中,一些原本仅有少量基因组代表的病毒组,如Astro-Poty、Hypo、Yan和Cysto类群,在本研究中得到了显著扩展,展现出更大的系统发育多样性。




AI工具的卓越表现




与其他病毒发现工具相比,LucaProt展现出了更高的敏感性和特异性。在识别已知RNA病毒方面,LucaProt的召回率高达98.22%,而其他工具仅能识别76.82%-87.81%。更重要的是,在发现新病毒方面,LucaProt的表现尤为出色,其他工具只能识别LucaProt独立发现的新病毒中不到42%的比例。LucaProt还成功召回了六项已发表研究中98%以上的病毒RNA依赖RNA聚合酶(RdRP),尽管这些序列并未用于模型的训练或测试。




超长RNA病毒基因组




研究发现了一些异常长的RNA病毒基因组,其中最长的达到了47.3kb,这是目前已知最长的RNA病毒基因组之一。这个特长基因组来自土壤样本中的Nido-like超级组。有趣的是,在这个病毒基因组的5'端和编码RdRP的开放阅读框之间,还发现了一个额外的开放阅读框,尽管由于缺乏与已知蛋白的序列相似性,其功能尚不清楚。这一发现挑战了我们对RNA病毒基因组大小的传统认知,暗示RNA病毒可能具有比我们想象更复杂的基因组结构和功能。




病毒基因组的模块化和灵活性




研究发现,除了RdRP,新发现的病毒基因组还编码了各种结构蛋白(如外壳、衣壳、糖蛋白和包膜蛋白)和非结构蛋白(如解旋酶、蛋白酶、甲基转移酶、运动蛋白、免疫或宿主相关调节蛋白)。这些额外的病毒蛋白的存在为新发现的超级组确实来自真实的RNA病毒提供了进一步的证据。有趣的是,这些蛋白的出现模式与从RdRP序列推断的病毒系统发育历史不一致,这表明RNA病毒基因组可能具有模块化的配置。



生态分布特征




研究发现RNA病毒在全球1,612个位置的各种生态系统亚类型(32个类别)中普遍存在。尽管之前已有多次努力揭示这些生态样本中的RNA病毒多样性,但本研究中LucaProt检测到的33.3%的病毒组此前未被描述。病毒的α多样性(用Shannon指数衡量)和丰度水平(用每百万非rRNA读数中的读数数量衡量,即RPM)在不同的生态系统亚类型之间存在显著差异。平均α多样性在落叶、湿地、淡水和废水环境中最高,而病毒丰度在南极沉积物、海洋沉积物和淡水生态系统亚类型中达到峰值,平均RPM范围为18,424.6至46,685.5。相比之下,盐岩和地下环境中的平均多样性和丰度最低。有趣的是,85.9%的新发现病毒仅在单一生态系统亚类型中被发现,这表明许多RNA病毒可能具有较强的环境特异性。




总结




这项研究极大地扩展了我们对RNA病毒世界的认知,揭示了自然界中存在着比我们此前认知更加丰富和多样的RNA病毒生态系统。研究结果不仅挑战了我们对RNA病毒进化和生态的传统理解,还为未来研究病毒与宿主的相互作用、病毒在生态系统中的作用等重要问题提供了新的视角和机会。

论文链接
https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7

撰文|Coral
责编|Asher
转载、交流、合作

联系我们

NeuroWorld

神经世界
聚焦神经科学领域前沿,报道脑科学与人工智能领域的最新动态。
 最新文章