数据要素x科技创新,深圳这个团队用大模型“创造”蛋白质
政务
2024-11-06 19:00
广东
近日
在2024年“数据要素X”大赛总决赛中
北京大学深圳研究生院
与深圳埃空间生物科技有限公司
联合开发的“AI+蛋白质设计”项目
获得了
广东省一等奖、全国总决赛二等奖
蛋白质是生命的基础,是生命活动的主要承担者。测定蛋白质结构和优化、设计蛋白质对于创新药研发、合成生物学等领域至关重要,也是生物学界最具挑战的问题之一。据悉,“AI+蛋白质设计”团队的项目侧重于探索大数据驱动的蛋白质设计科研范式。2024年诺贝尔化学奖获得者,来自谷歌DeepMind的Demis Hassabis和John M. Jumper在2020年研发的AlphaFold2在蛋白质预测关键评估大赛(CASP)中表现优越,解决了生物学过去50年的重大挑战。自此,科学家们开始探索大数据的蛋白质设计方法,用于提升药物研发的效率、降低药物研发的时间成本。深圳埃空间生物科技有限公司CEO程功指出,目前主流生物大分子药物以抗体、蛋白和多肽为主,如何针对特定靶标蛋白开发高效安全的大分子药物一直是业界研究难点。以AlphaFold3为代表AI软件在蛋白质结构预测方面的突破极大减少了设计序列的计算成本。但是上述模型功能停留在结构设计层面,仍需较大规模的湿实验验证,设计速度仍然不理想,达不到医药工业的需求。目前,将大模型应用在生物数据上,构建AI蛋白质生成大模型,提升蛋白质设计的效率和成功率等,成为大模型支持生物医药、合成生物等产业创新发展的重要方向。据介绍,“AI+蛋白质设计”团队侧重于探索大数据驱动的蛋白质设计科研范式,并取得了重要进展,提出了新的冷冻电镜成像算法,重建蛋白酶体底物降解动态自由能面,收集了特有的四维冷冻电镜独有数据,模拟了蛋白酶体构象连续体动力学变化,研发了国际领先(First in Class)靶点机制,进行多模态大模型训练,进行蛋白质设计、生成和筛选。大模型正在推动蛋白质设计进入“智能生成时代”,向产业级发展迈进坚实一步。相比目前的主流方法,“AI+蛋白质设计”实现了高成功率、高普适性和低使用门槛,可以大幅度降低实验测试以及后续的药物开发和合成的成本,并能优化和设计多种类型的蛋白质。“相当于有个云科学家在线指导,降低蛋白质设计难度。”程功介绍道,该项目可以让不具备计算能力的生物、医学研发人员更容易通过大模型描述一个蛋白质的功能来进行设计。例如,可以为AI+合成生物学提供设计源头,实现数字化合成生物AI设计“一键定制生成”,包括数字化生物工程和药物发现、生物合成新材料、合成生物固碳和生物碳中和材料、合成生物电子器件和生物传感、绿色能源生物合成技术、合成光伏生物器件、合成生物电池和低能生物和仿生器件。目前,深圳埃空间生物科技公司已完成种子轮融资,自研了多款心梗等心血管疾病小分子药物,已完成动物实验阶段;与江苏研发药企合作开发创新药物,同时与慢性病管理公司达成战略合作共同推动疾病预测模型。