CIBB 2024 | 分论坛一:生物设计与构建

文摘   2024-11-17 20:49   天津  



11月15日-18日,第十二届中国工业生物技术创新论坛暨生物制造产业大会在天津举行。本届大会以“合成生物,驱动生物制造”为主题,汇聚产学研各界嘉宾,围绕新形势下生物制造前沿创新与产业发展开展深入交流研讨,赋能新质生产力,为推动我国合成生物学和生物制造产业高质量发展启迪新思想、注入新活力、蓄积新动能。





分论坛一:生物设计与构建

生命科学与信息科学、工程科学的高度交叉融合,使生物体结构和功能的预测、调控与再造成为可能。本论坛聚焦人工智能和工程化理念在生物设计创制中的作用,探讨构建高性能人工生物体系的设计、构建和组装的新方法、新原理。


基于人工智能的蛋白质设计技术

刘海燕  

中国科学技术大学生命科学学院教授


蛋白质设计要解决的问题是如何根据预设的结构和功能目标来确定蛋白质的氨基酸序列。在将生成式人工智能模型用于蛋白质设计等科学问题时,需要额外地重点关注如何保证最终结果的物理合理性。我们通过在训练中引入生成对抗损失, 提升了降噪扩散模型生成实验可实现的蛋白质结构的成功率。我们还进一步发展了在蛋白质结构向量量化隐空间中扩散生成蛋白质结构的模型PVQD(protein structure vector quantization diffusion),能基于单序列预测天然蛋白质可能的多个构象状态,以及从头设计可折叠且具有内在柔性的蛋白质结构。我们通过在基于结构的序列设计模型中引入分子间互作、动态结构或序列进化信息,可以大幅提高功能蛋白设计的成功率,高效获得结构性质大幅改进的酶等功能活性蛋白。


酶分子设计与进化

孙周通  

中国科学院天津工业生物技术研究所研究员


酶是生命演化的核心功能单元,是合成生物学解析遗传与进化的金钥匙。大自然经过几十亿年的进化赋予人类丰富的酶资源宝库,也为生命向高阶进化提供了基础。虽然酶作为催化剂被广泛应用于人类生产生活的多方面,如:医药与健康、能源与材料、食品与环境等,但对其结构与功能的认知依然非常有限,而且其自然属性(天然功能)与应用属性(活性、稳定性和选择性)之间的不匹配阻碍了对酶资源的有效利用。酶分子工程通过降维设计和有限进化(筛选)可以有效解决新酶设计与新反应实现的困境。报告从酶蛋白序列空间关键氨基酸残基定位与精简密码子设计两个维度为切入点,阐述高质量突变体位点及其文库的降维设计,将计算设计与有限筛选相结合以解决序列空间搜索瓶颈,助力新酶新反应设计在手性催化及生物合成中的应用。


蛋白质序列-功能空间的进化压缩与AI重构

张数一  

清华大学药学院副教授


蛋白质作为最重要的生命构建单元之一,其序列和功能之间的映射(适应性景观,Fitness landscape)的针对性研究对于蛋白质理性设计以及工程应用都有极大的意义。目前人们只能对于蛋白质序列-功能关系进行少量低纬度的点采样,例如深度突变搜索(DMS),单位点饱和突变等,或是利用随机建库等方式以极低概率捕获序列与功能耦连的关键信息。一些更高效的定向进化工具如PACE,OrthoRep等会使得蛋白质空间的搜索深度加深,但由于其专注于产生高适应性突变体的特征使得其对于蛋白功能的全局认知不足。一些计算方法试图利用深度学习构建序列和功能的映射关系,但由于缺乏高质量大规模的序列-功能映射数据,计算方法的可延展性始终有所限制。总之,受限于蛋白质序列空间的高维度与复杂性(例如,100个氨基酸的蛋白质设计空间达到10130,远超宇宙中的原子数目~1080),我们对这个空间及其映射规律的理解尚浅,亟待丰富与完善。针对这些问题,我们提出了对蛋白质序列-功能空间进行压缩的概念,开发了进化扫描系统,可以高效获取空间压缩后的锚点(Anchor),并开发了相应的EvoAI系统,实现了对蛋白质序列-功能空间的进化压缩和AI重构,压缩比可以达到1048,对于理解蛋白质序列-功能空间映射关系引入了新的视角。


酶约束数字细胞建模

陈 禹  

中国科学院深圳先进技术研究院研究员


细胞工厂是合成生物制造的关键载体,其构建主要依靠反复试错。数字细胞建模是在计算机上模拟细胞的生命活动,可以提供理性设计方案,提高细胞工厂构建效率。基因组规模代谢网络模型是系统描述细胞代谢的数学模型,已经被广泛应用于合成生物学和系统生物学研究。然而,这类传统模型仅涉及代谢层面,难以全面解释细胞表型包含细胞;酶约束建模作为新一代数字细胞建模技术,通过在传统模型中整合酶活性参数,能够提升模型预测效果,并拓展模型应用场景。本报告介绍酶约束建模工具箱GECKO 3.0,并探讨酶约束模型在合成生物制造领域方面的应用。


Deciphering Universal Gene Regulatory Mechanisms with Foundation Model

李 鑫  

中国科学院动物研究所研究员


被称为20世纪人类三大科学计划之一的人类基因组计划拉开了深度解析生命奥秘的序幕。由于生命过程的多维度、高动态特点,传统实验研究手段难以系统精准地破解基因密码的底层共性规律。当前,以大模型为核心的人工智能技术在计算机视觉和自然语言处理等领域引发了新一轮科技革命,已展示出对复杂数据和知识的深入理解能力,运用人工智能强大能力实现基因组学的数据表征与知识发现,必将在生命科学研究领域带来革命性突破。通过对巨量的单细胞转录组数据进行自监督预训练我们成功构建了世界首个跨物种生命基础模型-GeneCompass。该模型首次使用了超过1.26亿的跨物种单细胞数据集、融合了包括启动子序列和基因共表达关系等四种先验知识,实现了对基因表达调控规律的学习与理解,支持多种生命过程的精准分析及细胞命运状态的变化预测,展示了人工智能赋能生命科学研究的巨大潜力。


数理双驱细胞工厂设计

李斐然  

清华大学深圳国际研究生院特别研究员


生物制造的芯片是细胞工厂,然而高效细胞工厂的开发耗时耗力,因此急需新技术和新方法来大幅降低试错成本。基因组尺度代谢网络模型被广泛应用于细胞工厂设计,然而其中仍存在多个瓶颈,如模型应用范围较为局限、可模拟生物过程不全面、参数测量缺乏、知识缺口较大等。为解决这些关键问题,我们开发了一种深度学习模型DLKcat,用于大规模预测酶参数,并构建了超大规模的开源酶数据库GotEnzyme。该数据库包含超过两千万个酶-底物对的酶活参数,是现有酶参数数据库测量数据的2000多倍。此外,为解决可模拟生命过程不全面的问题,我们开发了一种模块化的多生物学过程的基因组尺度模型,用于系统解析生命过程和模拟复杂表型。该模型包含详尽的蛋白分泌模块,成功预测了蛋白细胞工厂的系统改造靶点。预测的靶点在后续进行了大规模实验验证,大部分都可显著提高分泌蛋白产量。


AI大模型针对生物制造领域的创新探索

罗朝晖  

百图生科生物制造解决方案主任专家


技术突破和政策支持带来中国生物制造领域的商业价值和市场快速增长,通过聚焦推动生物技术与信息技术的融合,并围绕如何打造具有自主知识产权的工业菌种与蛋白元件库,更加环保与高效的服务于下游农业、饲料养殖、食品、发酵、能源与材料等相关产业。
百图生科作为生命科学领域AI大模型的世界领跑者,通过自研的AI全模态底座模型(蛋白、细胞、生产、视觉、文本等),本报告围绕如何通过AI大模型助力提升生物制造领域从研发到生产的各应用场景效率。


AI助力合成生物学蛋白和菌种设计改造

马红武  

中国科学院天津工业生物技术研究所研究员


由海量生物数据发现新的基因功能和调控机理、并构建系统水平的细胞模型对理解复杂生物系统组织规律和设计具有期望性能的人工生物具有重要意义。以AlphaFold、ChatGPT为代表的新一代人工智能技术正在引发包括生物学在内的科研范式变革。本报告介绍了本团队应用新的人工智能方法预测酶功能实现高质量代谢网络模型的自动化构建和质控,预测酶动力学参数和蛋白亚基组成构建多约束模型以及应用大语言模型从大量代谢工程改造文献中获得结构化数据建立高质量代谢工程改造数据库等方面的最新研究工作进展。旨在通过机理模型、文献知识和数据驱动人工智能算法的结合推动人工细胞工厂的高效设计构建。

BIOINN生物制造众创空间
生物技术专业化众创空间(简称BIOINN“Biotechnology Innovation\x26quot;)是依托于中科院天津工业生物所“技术创新”和“平台创新”而建设的创新创业孵化平台,由天津所全资资产管理公司中科育成(天津)科技发展有限公司建设并运营
 最新文章