Science|语言模型 EVOLVEpro 帮助各种蛋白实现定向进化

文摘   2024-11-22 08:16   广东  

蛋白质语言模型EVOLVEpro

protein language model EVOLVEpro

昨天,Science正刊上Kaiyi Jiang等人发表了题为“Rapid in silico directed evolution by a protein language model with EVOLVEpro”的文章,开发了名为EVOLVEpro的高效的蛋白进化方法,它结合了蛋白质语言模型(PLMs)和回归模型,通过少量实验数据快速实现蛋白质进化。

关键词

蛋白语言模型、蛋白进化、Science

The following article is from  GenomicAI.

正文

EVOLVEpro 通过主动学习的方式,在几轮迭代中就能显著提高了蛋白质的期望性质,如结合亲和力、催化效率和免疫原性。

该框架在多个蛋白质上进行了测试,包括RNA生产、基因组编辑和抗体结合应用,显示出比现有方法更高的改进幅度

1. EVOLVEpro方法概述

EVOLVEpro的核心是一个模块化设计(图1),其中PLM编码蛋白质序列并将其映射到连续的潜在空间,回归模型则学习该空间与蛋白质活性之间的关系。每轮进化,模型通过评估一小部分突变体的实验结果,逐步更新并预测下一轮突变体。这种方法使得EVOLVEpro能够有效探索多种活性区域,从而避免局部最优解的困扰。

图1:EVOLVEpro的框架和工作原理

2. 抗体改造

图2展示了使用EVOLVEpro对两种单克隆抗体(C143和aCD71)进行工程改造的过程。 在抗优化实验中,EVOLVEpro对两个重要单克隆抗体(C143和aCD71)进行了目标优化,提高了抗体的结合亲和力和表达水平。通过四轮进化,最终获得了显著增强的结合亲和力,特别是C143抗的亲和力提高至60pM,展示了该方法在抗体工程中的潜力。

图2:抗体优化案例

3. CRISPR核酸酶改造

图3展示了使用EVOLVEpro工程改造高度活跃的微型CRISPR核酸酶(PsaCas12f)。 EVOLVEpro同样应用于CRISPR核酸酶的优化,提高其基因编辑能力。经过四轮进化,通过结合多个突变体,研究团队成功获得了活性比原始PsaCas12f高出4.9倍的突变体,最终获得的epPsaCas12f在多个基因组靶点上的编辑效率均显著提高,这说明该在基因编辑应用中的广适用性。

图3:引导的CRISPR核酸酶的进化

4. 改造Prime编辑器

图4展示了使用EVOLVEpro改造Prime编辑器(PE2)。 在对Prime Editor进行优化的过程中,EVOLVEpro通过主动学习逐步提高了插入效率。经过数轮进化,新突变体在多个基因组位上均表现出更好的活性和通用性,显示EVOLVEpro在复杂编辑任务中的有效性。

图4:改进的Prime Editor

5. 高效聚合酶的进化

图5展示了为高产量和低免疫原性mRNA生产而改造的RNA聚合酶(T7 RNAP)。 EVOLVEpro还被用于T7聚合酶的多目标优化,旨在提高RNA的产量、翻译效果和纯度。经过四轮进化,E643G突体的翻译效率提高了34倍,同时免疫原性降低了98%。该研究证明了EVOLVEpro在mRNA生产中的巨大潜力,尤其是在需要高纯度和高效录应用中。

图5:高效聚合酶的进化

6. 环状RNA的生产

图6展示了使用epT7进行环状RNA生产和体内生物发光的应用程序。 利用epT7突变体,团队进一步探索了环状RNA的生产效率,发现其转录效率显著高于WT T7 RNA聚合酶。通过对转录质量的分析,表明epT7能够有效减少免疫原性并提高环状RNA的纯度,为未来的治疗应用奠定了基础。

总结

EVOLVEpro展示了在蛋白工程中的巨大潜力,通过结合先进的机器学习技术和实验验证,实现了对多个生物分子活显著提升。

该方法不仅提高了突变体的效率,还优化了多特性,为生物医学研究和疗法开发开辟了新的可能性。

未来,EVOLVEpro有望在更广泛的领域中得到,推动蛋白质工程的进一步发展。

文献代码

[1] Jiang, Kaiyi, et al. "Rapid protein evolution by few-shot learning with a protein language model."Science (2024): 2024-07.

[2]https://github.com/mat10d/EvolvePro

进群交流

进群请认真填问卷!

广告勿扰,广告勿扰

往期合集

干货文章线上报告蛋白设计综述BinderCo-designBenchmarkAF3David BakerESMMaSIF结构预测语言模型骨架生成逆向折叠抗体设计多肽设计酶设计稳定性药物设计

关注我们

死磕自己,愉悦大家

专注于AI蛋白相关的论文解读&学术速运


历史文章

  1. AlphaFold3 图解

  2. AlphaFold3 万字长文解读

  3. AlphaFold3 预测蛋白突变亲和力变化?

  4. 一文看懂 Binder 设计

  5. 蛋白结构和序列的共同设计

  6. 深度学习如何助力抗体设计

  7. 蛋白计算海内外课题组汇总

  8. Meta AI 蛋白语言模型ESM系列

  9. COMPSS 酶蛋白从头设计的筛选方法

  10. 简述酶的定向进化

  11. Cell 综述:从头蛋白设计之结构到功能

  12. CSH 综述文章:结构预测与蛋白设计

  13. CSH 综述文章:蛋白质序列的生成模型

  14. Nat. Biotech. 蛋白设计专刊

  15. Nat. Biotech. 深度学习与功能蛋白设计

  16. Nat. Biotech. 功能蛋白从头设计的星火

  17. ProteinBench 蛋白设计最全的Benchmark

  18. ProteinGym 蛋白突变最好的Benchmark

  19. DiG 预测蛋白构象分布

  20. MaSIF 基于表面指纹的蛋白从头设计

  21. SaProt 结构感知的蛋白质语言模型

  22. InstructPLM 语言模型与逆向折叠的结合

  23. CRISPR-GPT 基因编辑的大模型智能体



AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
 最新文章