Interprodesign AI-PPI筛选算法模型惊艳亮相,5天解锁蛋白互作筛选!

文摘   2024-11-08 09:01   广东  

点击蓝字 关注我们




产品概述



蛋白质-蛋白质互作(PPI)在动植物生物学中扮演了关键角色,它们驱动了许多细胞功能和生物过程。因此,识别蛋白质间的互作对于理解生物机制及开发药物和生物技术应用至关重要。传统的筛选方法(如Y2H、COIP等)验证蛋白互作往往耗时长、效率低,并且需要大量的实验资源。为了提高筛选效率,近年来高通量虚拟筛选技术和AI模型的进步使得基于结构和序列的互作预测成为了可能。

本产品旨在利用前沿的生成模型RFdiffusion从头设计人造高互作蛋白质,并结合FoldseekHDOCKAlphaFold 3等先进工具,对天然蛋白质进行筛选和验证。我们将这套新型计算工作流程命名为InterProDesign(IPD,Interaction Protein Design)。通过IPD能够更加高效且精准地筛选出与诱饵蛋白相互作用的天然蛋白,为进一步的实验验证提供重要参考。



InterProDesign 产品流程



参考文献指示该计算工作流程实验验证成功率超过78%为研究动植物生物机制提供重要的结构生物学信息。


PART/ 01


RFdiffusion 设计互作蛋白

基于已知诱饵蛋白结合热点的判断,从头设计10条不同长度的高互作蛋白质。


PART/ 02


Foldseek 搜索天然蛋白

在目标物种的蛋白质三维结构数据库,比对寻找结构相似的天然蛋白,并按分数高低排序(仅保留 bit score>50 的匹配结果)。


PART/ 03


HDOCK 结合能评价

对于上一轮Foldseek筛选出的结构高相似天然蛋白,量化评估它们与诱饵蛋白之间的量化结合能,筛选出结合能较低的天然蛋白(结合能越低,结合越稳定)。


PART/ 04


AlphaFold 3 整体评价

在pTM(模版预测得分)较高的基础上,通过ipTM(界面模板预测得分)去进一步评估候选互作蛋白与诱饵蛋白整体复合结构的置信度。



拟交付结果示意



如图1,数据总表中包括所有步骤的结果。

红色方框内是RFdiffusion 基于诱饵蛋白所自主设计的10条互作蛋白序列,并将人造蛋白与诱饵蛋白对接评估。

绿色方框内是Foldseek 根据设计蛋白从待选物种库内筛选得到的结构相似天然蛋白。其中也存在人造蛋白没有bit score大于50的天然蛋白。

蓝色方框内是诱饵蛋白与候选天然蛋白从量化结合能和整体置信度评估的结果,稳定互作的高评分蛋白已标红强调,可以为后续实验验证提供指导。

如图2所示,是所有候选蛋白的详细信息,包括蛋白质的ID、基因名称、序列、物种、亚细胞定位、功能注释和所属家族。

图1: 数据总表示意图

图2: 候选蛋白注释信息



产品优势



1

创新型计算方法

本产品基于计算模型的预测与筛选流程,可以大幅缩短筛选时间并减少实验工作量。通过RFdiffusion、Foldseek、HDOCK和AlphaFold等工具的结合,能够在早期阶段快速预测出与诱饵蛋白可能发生互作的候选蛋白。多维度评估使得最终筛选出的互作蛋白更加可靠,提升了后续实验验证的成功率。

2

结构导向型的精确筛选

本产品更多依赖蛋白质的三维结构进行筛选。结构相似性在跨物种或功能多样性大的蛋白质互作中的至关重要。基于结构的筛选方法能够识别出那些序列相似度低但具有相似功能的蛋白质。

参考文献

1.Watson, J. L., et al. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620, 1089-1099.

2.Haley, O. C., Harding, S., Sen, T. Z., Woodhouse, M. R., Kim, H.-S., Andorf, C. (2024). Application of RFdiffusion to predict interspecies protein-protein interactions between fungal pathogens and cereal crops. bioRxiv, doi: 10.1101/2024.09.17.613523.

3.Watson, J. L., Juergens, D., Bennett, N. R., Trippe, B. L., Yim, J., Eisenach, H. E., ... & Baker, D. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620(7685), 1089-1098.

4.Baek, M., DiMaio, F., Anishchenko, I., Dauparas, J., Ovchinnikov, S., Lee, G. R., ... & Jumper, J. (2021). Accurate prediction of protein structures and interactions using a three-track neural network. Science, 373(6557), 871-876.

5.Lin, Z., Rigden, D. J., & McGuffin, L. J. (2023). Language models of protein sequences at the scale of evolution enable accurate structure prediction. Science, 379(6631), 1123-1130.

6.Dauparas, J., Anishchenko, I., Bennett, N. R., Bai, H., Ragotte, R. J., Milles, L. F., ... & Baker, D. (2022). Robust deep learning-based protein sequence design using ProteinMPNN. Science, 378(6615), 49-56.

SHOPPING

🎉双十一福利GO🎉

🔥 新品特惠Interprodesign互作蛋白筛选服务限时5折,现仅需4900元/蛋白!

📢 满五送一:购买多模态互作蛋白筛选服务满五单再送一单,单价5800元/蛋白!

💥 预存膨胀:活动期间预存2万元送2000元膨胀金(预存金额与膨胀金比例:10:1)。膨胀金可累计计算无使用门槛不设有效期限制!

💰 老客户福利活动期间下单金额或者发票金额超过5000的老客户,下单立减600元。老客户推荐新客户购买Interprodesign服务,享200元京东卡奖励

📲 转发奖励:购买公司任意产品的客户,转发活动链接至朋友圈集齐66个赞,额外立减200元

💬模型体验:扫码添加业务员微信,转发朋友圈集齐28个赞,即可免费体验以下模型服务一次。



生信石头
记录和分享生信学习经验和数据处理技巧
 最新文章