蛋白质语言模型EVOLVEpro
protein language model EVOLVEpro
昨天,Science正刊上Kaiyi Jiang等人发表了题为“Rapid in silico directed evolution by a protein language model with EVOLVEpro”的文章,开发了名为EVOLVEpro的高效的蛋白进化方法,它结合了蛋白质语言模型(PLMs)和回归模型,通过少量实验数据快速实现蛋白质进化。
关键词
蛋白语言模型、蛋白进化、Science
The following article is from GenomicAI.
正文
EVOLVEpro 通过主动学习的方式,在几轮迭代中就能显著提高了蛋白质的期望性质,如结合亲和力、催化效率和免疫原性。
该框架在多个蛋白质上进行了测试,包括RNA生产、基因组编辑和抗体结合应用,显示出比现有方法更高的改进幅度。
1. EVOLVEpro方法概述
EVOLVEpro的核心是一个模块化设计(图1
),其中PLM编码蛋白质序列并将其映射到连续的潜在空间,回归模型则学习该空间与蛋白质活性之间的关系。每轮进化,模型通过评估一小部分突变体的实验结果,逐步更新并预测下一轮突变体。这种方法使得EVOLVEpro能够有效探索多种活性区域,从而避免局部最优解的困扰。
2. 抗体改造
图2
展示了使用EVOLVEpro对两种单克隆抗体(C143和aCD71)进行工程改造的过程。 在抗优化实验中,EVOLVEpro对两个重要单克隆抗体(C143和aCD71)进行了目标优化,提高了抗体的结合亲和力和表达水平。通过四轮进化,最终获得了显著增强的结合亲和力,特别是C143抗的亲和力提高至60pM,展示了该方法在抗体工程中的潜力。
3. CRISPR核酸酶改造
图3
展示了使用EVOLVEpro工程改造高度活跃的微型CRISPR核酸酶(PsaCas12f)。 EVOLVEpro同样应用于CRISPR核酸酶的优化,提高其基因编辑能力。经过四轮进化,通过结合多个突变体,研究团队成功获得了活性比原始PsaCas12f高出4.9倍的突变体,最终获得的epPsaCas12f在多个基因组靶点上的编辑效率均显著提高,这说明该在基因编辑应用中的广适用性。
4. 改造Prime编辑器
图4
展示了使用EVOLVEpro改造Prime编辑器(PE2)。 在对Prime Editor进行优化的过程中,EVOLVEpro通过主动学习逐步提高了插入效率。经过数轮进化,新突变体在多个基因组位上均表现出更好的活性和通用性,显示EVOLVEpro在复杂编辑任务中的有效性。
5. 高效聚合酶的进化
图5
展示了为高产量和低免疫原性mRNA生产而改造的RNA聚合酶(T7 RNAP)。 EVOLVEpro还被用于T7聚合酶的多目标优化,旨在提高RNA的产量、翻译效果和纯度。经过四轮进化,E643G突体的翻译效率提高了34倍,同时免疫原性降低了98%。该研究证明了EVOLVEpro在mRNA生产中的巨大潜力,尤其是在需要高纯度和高效录应用中。
6. 环状RNA的生产
图6
展示了使用epT7进行环状RNA生产和体内生物发光的应用程序。 利用epT7突变体,团队进一步探索了环状RNA的生产效率,发现其转录效率显著高于WT T7 RNA聚合酶。通过对转录质量的分析,表明epT7能够有效减少免疫原性并提高环状RNA的纯度,为未来的治疗应用奠定了基础。
总结
EVOLVEpro展示了在蛋白工程中的巨大潜力,通过结合先进的机器学习技术和实验验证,实现了对多个生物分子活显著提升。
该方法不仅提高了突变体的效率,还优化了多特性,为生物医学研究和疗法开发开辟了新的可能性。
未来,EVOLVEpro有望在更广泛的领域中得到,推动蛋白质工程的进一步发展。
文献代码
[1] Jiang, Kaiyi, et al. "Rapid protein evolution by few-shot learning with a protein language model."Science (2024): 2024-07.
[2]https://github.com/mat10d/EvolvePro
进群交流
进群请认真填问卷!
广告勿扰,广告勿扰。
往期合集
干货文章|线上报告|蛋白设计|综述|Binder|Co-design|Benchmark|AF3|David Baker|ESM|MaSIF|结构预测|语言模型|骨架生成|逆向折叠|抗体设计|多肽设计|酶设计|稳定性|药物设计
关注我们
死磕自己,愉悦大家
专注于AI蛋白相关的论文解读&学术速运