中山大学医学院是中山大学拥有深圳校区的缘起,学院的建设是整个深圳校区战略布局的重中之重。论文发布后,深圳卫视&壹深圳客户端记者第一时间对施莽教授进行了采访。
传统病毒发现方法遇瓶颈
人工智能突破“已知”探“未知”
传统的病毒发现方法包括病毒分离和生命组学的生物信息学分析,高度依赖既有知识,面对RNA病毒这种高度分化、种类繁多且容易变异的病毒识别效率低。
在该研究中,团队开发的LucaProt人工智能算法能够对病毒和非病毒基因组序列深度学习,并在数据集中自主判断病毒序列。
施莽向记者介绍说:“我们搭建的AI驱动模型——LucaProt模型,不仅能够准确鉴定RNA病毒,还可以发现传统方法无法发现的病毒,突破了我们对整个病毒圈的认知。”
利用这套算法,研究团队在来自全球生物环境样本的10,487份RNA测序数据中发现了超过51万条病毒基因组,代表超过16万个潜在病毒种及180个RNA病毒超群。其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质”。
施莽表示:“人工智能是一种数据驱动的方法。在人工智能的框架下,我们首先收集大量优质数据,让人工智能通过学习这些数据找到规律,帮助我们进行判断和预测,并反馈它所学到的内容。人工智能是一个非常强大的工具,未来必将在科研的各个领域得到广泛应用。”通过进一步分析,团队报告了迄今最长的RNA病毒基因组,长度达到47250个核苷酸,并发现了超出以往认知的基因组结构,展现出RNA病毒基因组进化的灵活性。同时,团队还识别到多种病毒功能蛋白,特别是与细菌相关的功能蛋白,进一步表明还有更多类型的RNA噬菌体亟待探索。“面对远源的新病毒,现有的病毒分类体系已经显得力不从心。未来,这一体系在门、纲等更深层次的分类上,可能会有大规模的调整。”施莽说,“我们的研究展示了病毒多样性的深度,但广度仍有待更多样本的补充。病毒的多样性远超人类想象,我们目前所看到的仍是冰山一角。”“我非常幸运能来到深圳”
在纯粹包容的科研环境中谋发展
高校是基础研究主力军和重大科技突破策源地,更是科技成果的“富矿”。谈及这次在中山大学医学院取得这项科研新成果的感受,施莽说:“我非常幸运能来到深圳!”他告诉记者,中山大学医学院不仅引进了来自全球的优秀人才,也为团队提供了优越的研究环境、充足的空间和先进的设备,给予了团队一个非常包容的科研环境。施莽还提到:“更为重要的是,深圳政府给予了我们强有力的支持,成为我们能够专注于高水平研究的坚实基础,让我们能够安心地投入到科研工作中。”在深圳,高校和企业之间更是搭建起了双向“直通车”,产学研基地、联合实验室和创新平台遍布各区,科技成果转化实现了“双向奔赴”。施莽说:“要鼓励高校和企业多合作!高校的优势在于学术积累和研究氛围,而企业的强项是效率和资源,两者结合能产生很多新的想法和成果。”施莽表示,希望未来继续与阿里云飞天实验室通过跨领域科研合作,比如评估哪些病毒可能成为下一次引发全球大流行的X病原等等。记者 / 唐萍
编辑 / 王海苹 李柳荧
审校 / 靳阳懿 毛芸