针对蛋白特性的定向进化是蛋白质工程的“利器”,但是实验比较繁琐,且容易陷入局部最优[1]。一些基于蛋白语言模型的虚拟进化工具虽然避免了复杂的实验,但是提供的帮助也有限,毕竟蛋白的适应性和活性很多时候并没有直接的关联[2]。
为此,哈佛医学院Omar O. Abudayyeh以及Jonathan S. Gootenberg等研究人员开发新框架-EVOLVEpro(evolution via language model–guided variance exploration for proteins) ,在蛋白语言模型[3]的基础上,进一步结合回归模型(random forest regression)来从迭代的实验中主动学习蛋白活性的 “地貌图”,从而实现直接以蛋白活性,乃至结合预设的其它多种性能指标(表达量、引发的免疫反应强度等)为目标的高效蛋白进化[2]。
EVOLVEpro概览[2]。
进一步,研究人员通过EVOLVEpro实现了更强结合的抗体、更高效的基因编辑以及更高质/量的RNA表达等,其中某些性能参数提高百倍以上[2]。
通过EVOLVEpro定向进化更强结合且易于表达的抗体[2]。
该项工作2024年11月21日发表在Science[2]。
研究人员表示接下来结合进一步的蛋白语言模型和强化的搜索策略(比如进一步结合生物物理模型),该方法将进一步帮助蛋白工程[2]。
Comment(s):
非常实用的工具;
看来特别适合与蛋白从头设计结合,快速产生强效的功能蛋白。