西湖大学工学院李文彬团队&李子青团队:分子模拟与人工智能揭示四肽与五肽全序列空间内短肽聚集规律

学术   2024-09-03 17:10   浙江  

论文链接:http://doi.org/10.1021/jacsau.4c00501

论文原文请点击文末“阅读原文”跳转阅读


短肽的聚集过程是自然界中一个至关重要且复杂的物理化学现象,它在蛋白质的折叠、功能表达以及多种神经退行性疾病的发病机制中扮演着关键角色。此外,短肽的聚集特性对于其在生物医学和工业领域的应用至关重要,包括药物递送系统、组织工程、催化剂和半导体材料等。然而,短肽的精确聚集控制一直是一个巨大的挑战,因为它不仅依赖于肽序列中特定氨基酸的类型和排列顺序,还受到环境条件如pH值、溶剂组成和细胞内环境因素的影响。


因此,揭示短肽聚集的基本规律,以及预测和调控其聚集行为,对于开发新的疾病治疗策略和创新肽基材料具有重要的科学意义和应用价值。然而,即便是仅包含五个氨基酸残基的短肽,其潜在的序列组合就已超过三百万种,这使得系统地探索整个序列空间内的聚集行为成为一个艰巨的任务。为了克服这一挑战,必须解决肽聚集预测的准确性、计算效率和实验验证等多重难题。


图1:基于Transformer回归网络(TRN)模型,研究团队预测了四肽16万和五肽320万序列的聚集倾向性(AP)值。根据预测的AP值,团队分析了(a)20个氨基酸及400个氨基酸对的类型和位置对AP的贡献;(b)五肽AP值与两个相应四肽AP平均值之间的相关关系;(c)四肽聚集体的形貌分布以及20个氨基酸的类型和位置对不同形貌的影响。


李文彬实验室与李子青实验室联合开发了一种基于Transformer架构的人工智能(Artificial Intelligence, AI)模型,用于预测四肽及五肽的聚集倾向性(Aggregation Propensity, AP)。该模型通过粗粒化分子动力学模拟(Coarse-Grained Molecular Dynamics, CGMD)生成的AP数据进行训练,并通过与165个独立实验结果【Nat. Commun. 14, 3880 (2023)】进行了比较验证,验证了其约94%的预测准确率。研究团队基于预测的16万四肽及320万五肽AP数据集,不仅分析了序列中单个氨基酸的类型和位置对聚集行为的影响,还深入探讨了氨基酸对(即相邻氨基酸)的组合效应,从而在四肽和五肽的完整序列空间内首次推导出了“一级”与“二级”聚集规则。研究揭示了特定氨基酸如色氨酸(Trp, W)、苯丙氨酸(Phe, F)和酪氨酸(Tyr, Y)在促进聚集方面的显著作用,尤其是当它们位于肽链的中部至羧基端(C-terminus)时尤为显著。同时,研究还发现,诸如异亮氨酸(Ile, I)、亮氨酸(Leu, L)、缬氨酸(Val, V)等在肽链的氨基端(N-terminus)或中间位置时,亦能有效促进聚集。通过归因分析(Attribution Analysis),本项研究量化了每个氨基酸对肽聚集倾向性的贡献度,为理解特定氨基酸如何影响聚集过程提供了深入见解。


进一步地,本研究探索了四肽和五肽之间聚集倾向性的转移性关系,并发现通过在四肽序列的羧基端添加或移除特定氨基酸,可以有效调节五肽的聚集行为。这一发现为设计具有特定聚集特性的肽序列提供了新的策略,并可能对药物设计、疾病治疗以及功能材料的开发等领域产生重要影响。


影响多肽聚集体物理化学性质及其功能性的另外一个关键因素为聚集体形貌。本研究通过对20,000余个四肽聚集体形貌的系统评估,定量分析了聚集体形貌的分布以及每种氨基酸对特定形貌(如纤维、球体、网状结构)形成的贡献,为设计具有特定聚集特性的肽基材料和药物等提供了重要的科学依据。基于西湖大学王怀民团队和李文彬团队前期合作发表的研究【Nat. Commun. 14, 3880 (2023)】,此项工作将CGMD的形貌模拟结果与实验透射电子显微镜(TEM)图像进行了对比。通过对比分析发现,本研究达到了超过50%的形貌吻合率,这一结果验证了CGMD模拟在聚集体形貌预测上具有一定的准确性和可靠性,而且通过系统地分析模拟与实验结果之间的差异,为提高未来模拟与实验吻合率提供了理论基础和改进方向。


这些研究成果不仅为短肽的自组装行为提供了深刻的理解,也为未来的肽设计和应用提供了新的基础理论,为生物材料、药物开发及疾病治疗、催化剂、半导体等领域提供了海量的材料库与广阔的发展前景。


本项研究成果以题为“Aggregation Rules of Short Peptides”为题发表在国际知名期刊JACS Au上。论文共同第一作者为李文彬课题组助理研究员汪嘉琪博士(现西交利物浦大学助理教授)、李子青课题组2020级博士生刘子寒、李文彬课题组科研助理赵爽(现清华大学博士生)。西湖大学工学院特聘研究员李文彬、西湖大学人工智能讲席教授李子青、温州医科大学研究员徐腾焱为论文共同通讯作者。本项工作得到了西湖大学未来产业中心、国家自然科学基金,以及科技部国家重点研发计划的支持。




 来 源  | 李文彬实验室

 撰 稿  | 汪嘉琪、李文彬

 编 辑  | 彭玥

 审 核  | 苏凌菲

 

西湖大学工学院面向国家战略性新兴产业发展重大需求,着力建设交叉学科与新兴学科为特色的工程技术学科群,努力建成国家重大科学技术研究和拔尖创新人才培养的重要基地。工学院以国际高端人才为学科带头人构建科研团队,分阶段、分领域打造一流人才队伍。


工学院目前重点建设七大研究领域 (Programs)——人工智能与数据科学、生物医学工程、化学与生物工程、电子信息科学与技术、材料科学与工程、机械科学与工程、可持续发展与环境工程。围绕七大领域,工学院已建成一批高水平实验室和研究中心,其中已获批成立全省3D微纳加工和表征研究重点实验室、全省智能低碳生物合成重点实验室,培育建设浙江省海岸带环境与资源研究重点实验室,建立微纳光电系统集成浙江省工程研究中心。

扫描二维码 | 关注我们

西湖大学工学院

School of Engineering

Westlake University


西湖大学工学院SOE
西湖大学工学院致力于面向国家战略性新型产业发展重大需求的科技创新和人才培养,建立交叉学科与新兴学科为特色的应用科学、工程技术学科群,建成国家重大科学技术研究和拔尖创新人才培养的重要基地。
 最新文章