文章来源于阿里云:
10月10日,阿里云与中山大学合作的科研成果登上国际顶级学术期刊《Cell》,研究团队利用云计算与AI技术发现了180个超群、16万余种全新RNA病毒,是已知病毒种类的近30倍,大幅提升了业界对RNA病毒多样性和病毒演化历史的认知。
病毒与人类的健康密切相关,但人类已知已确认的病毒种类仅有5000余种,这只是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病毒”,新病毒发现的效率较低。
AI与病毒学研究的结合正在突破这一难题。本篇论文提出了全新的深度学习模型"LucaProt",它基于Transformer框架与大模型表征技术,结合蛋白质序列和内在结构性特征,在独立的测试数据集上表现优异,具有极高的准确性(假阳性率仅为0.014%)和特异性(假阴性率为1.72%)。
研究团队对来自全球生物环境样本的10,487份数据进行病毒挖掘,发现了513,134条病毒基因组,代表161,979个潜在病毒种及180个RNA病毒超群。使RNA病毒超群数量扩容约9倍,病毒种类增加约30倍,其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质“。
该论文还揭示了多个病毒学领域新发现:发现迄今为止最长的RNA病毒基因组,长度达到47,250个核苷酸;识别出超出以往认知的基因组结构,展示了RNA病毒基因组进化的灵活性;此外,在高温的深海热泉等极端环境中,RNA病毒依旧存在多样性。
过去几年,阿里云积极与国内高校和研究机构展开合作,在生命科学领域已发表核酸和蛋白质统一基础模型-LucaOne、RNA病毒发现-LucaProt、磷循环蛋白家族识别-LucaPCycle等研究成果。
《Cell》是国际公认学术声誉最高的期刊,代表生命科学领域的最高水平。国内每年入选《Cell》的论文数量仅有数十篇。此次入选的论文提出了一种基于深度学习的RNA病毒发现方法,是深度学习算法在病毒发现领域的里程碑式进展,为病毒学研究开创了全新范式。
版块介绍 — 产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
推荐阅读
Reading
2、观察|“兼济天下”与“产业繁荣”:从中法联合声明看中国的“AI力”
3、智能背后的电能保障:GPU算力集群能源挑战的全球视角与中国应对
4、产业之声 | 阿里调研:生成式AI在电商场景的应用、前景与挑战
6、阿里云内部全面推行AI写代码,未来20%代码由通义灵码编写
9、安全治理与能力发展兼顾并重,Claude 3对中国大模型发展有哪些启示
10、【“人工智能+”深度案例】从智能工厂到ChatBI,雅戈尔的“智能+”实践
14、《自然·医学》刊登中国科学家关键突破:癌症筛查的黄金时代准备就绪
16、【观点】阿里妈妈万相实验室首发上线 电商进入AI上新新时代
20、产业之声 | 为AI供电-超万卡GPU算力集群的算电协同与零碳发展
21、产业之声 | “软硬兼施,以软带硬” - 缓解“算力焦虑”的模型与芯片协同优化策略
23、“形”“型”合璧,恰逢其会-人形机器人是大模型技术的高级呈现形态
24、具身智能系列 | 人形机器人会替代机械臂吗?- 人形机器人在制造业中的定位与价值分析
25、产业之声|大模型问月:首个月球科学多模态专业大模型发布