蛋白计算模型预测突变热稳定性
今天为大家介绍的 Nat. Mach. Intell. 的一篇论文。用一些蛋白设计工具去评估蛋白稳定性变化。本文探讨了模型之间的互补性,以及多特征ensemble去预测稳定性的帮助。
结果
1. Benchmark
作者使用了8种不同的蛋白设计工具,在4个不同的数据集上做了Benchmark,发现突变稳定性的预测ProteinMPNN模型最好。这其实在proteinGym的结果也可以看出,没有什么意外的。另外,笔者疑惑ESM-IF为什么没有在这个图里面,按照ProteinGym的结果,这里ESM-IF极有可能表现更优。
2. 模型互补性
从图3
可以看到,任意2个模型的组合combination,似乎对稳定性的预测都有提升(图中右上角为红色),这就说明稳定性的预测可以多个模型两两组合。其中Oracle和Cartesian DDG的组合表现最好,在图中左上角。
3. 多特征ensemble
从图4
可以看到,随着特征数量的增加,基本上所有模型的预测能力都有所增加。在4-5个特征的时候得到收敛。
综上,这个文章有2个重要的结论:
模型的两两组合对突变稳定性预测有提升 多特征ensemble对稳定性预测有提升
参考文献
[1] Reeves, S., Kalyaanamoorthy, S. Zero-shot transfer of protein sequence likelihood models to thermostability prediction.Nat Mach Intell 6, 1063–1076 (2024).
进群交流
进群请认真填问卷!
广告勿扰,广告勿扰。
往期合集
干货文章|线上报告|蛋白设计|综述|Binder|Co-design|Benchmark|AF3|David Baker|ESM|MaSIF|结构预测|语言模型|骨架生成|逆向折叠|抗体设计|多肽设计|酶设计|稳定性|药物设计
关注我们
死磕自己,愉悦大家
专注于AI蛋白相关的论文解读&学术速运