GROMACS文献学习1-碳酸酐酶结构和催化机制的同源建模与分子模拟

文摘   科学   2024-07-16 20:07   江苏  
欢迎关注上方生信实战公众号,获取更多生物信息学知识和技能。

最新入群政策:本公众号建立了5个生信专业微信交流群:《生信工作职业交流群》《分子模拟分群》《生信分析-单细胞群》《R-Python编码群》《IT高级技术群》,由于广告骗子太多,需要加群的按需添加微信coding_gene,付费35元,选择加入任意多个群。

内部GROMACS讲义文档:

GROMACS入门讲义文档160页+分子模拟微信群-长期有效

Gromacs蛋白质结构模拟入门简明步骤


要完成一篇分子模拟相关的文章或毕业论文,大致的过程就是选择序列-->建立模型-->分子对接(可选)--> 结构模型评估和确定-->分子动力学模拟-->模拟结果分析-->生物学意义分析…… 
这里分享一些公开发表的比较实用、典型的GROMACS分析模拟相关的文章、文献、毕业设计等。今天介绍的这篇文章在蛋白质结构分析与模拟方向非常典型。具体大家参考下面的说明和原文利用同源建模、分子模拟和分子对接技术分析家蚕中碳酸酐酶的结构和催化机制

1. 概述   

以家蚕的碳酸酐酶为研究对象,利用同源建模建立了家蚕碳酸酐酶的三维结构并预测了其潜在的活性区域。利用Autodock-Vina对家蚕碳酸酐酶和底物进行分子对接,分析和评价了对接模型以及与乙酸对硝基苯酯底物对接过程中的相互作用。
经分子动力学模拟和MM/PBSA, 分析催化过程中家蚕碳酸酐酶的均方根偏差、溶剂可及面积以及径向分布函数。

2. 软件和工具   

家蚕碳酸酐酶的基因和蛋白质序列信息来源于NCBI与SilkDB3.0数据库。NCBI是美国国家分子生物学信息资源中心,可被用于检索和分析基因组数据等。SilkDB3.0是由西南大学蚕丝科学与技术研究团队维护的家蚕的多组学数据库,可进行可视化的多组学分析。蛋白质立体结 构信息从蛋白质结构数据库RCSB PDB 获得。
         
利用SWISS-MODEL计算平台和Modeller软件进行蛋白质建模。其中SWISS-MODEL是一个自动化的蛋白质比较建模服务器。Modeller是一款同源建模软件,主要用于家蚕碳酸酐酶的优化与评价。利用 PROCHECK评价蛋白质结构合理性。利用分子三维结构显示软件PyMol对蛋白质三维结构进行可视化分析。
         
         
通过Gromacs软件考察酶在催化过程中结构变化及反应体系的状态变化。AutoDock-Vina是由Scripps研究所的Olson实验室开发与维护的分子对接 的开源软件,用于对乙酸对硝基苯酯底物与家蚕碳酸酐酶分子对接计算,获得最优的对接结果,获得对接模型后,结合gromacs的MM/PBSA分析插件,共同分析家蚕碳酸酐酶与底物间相互作用的具体数值和具体部位。
         
MM/PBSA是利用分子力学和连续介质模型来计算蛋白和配体之间存在的结合自由能,其中配体可以是蛋白、小分子或者多肽,在该方法中,计算分子力学 (MM)、极性溶剂化能 (PB)、 非极性溶剂化能 (SA)的相关能量得以被分解计算及分析。
         

3. 从序列到结构  

         
在NCBI数据库和SilkDB3.0中获得家蚕碳酸酐 酶的信息 (XP004922882.1) 序列为:MDNRTVKIDPKFLSAQPKKTSSDAEHISRLRPSQSPIAISLSRCPTWSSLDPLKFKGYWDSNANAILLNNGSTAYFTFNDASVRPTLSGGPLIGEYIFEQMHFHWSVDDFTGCEHVLDGHGYAAECHFVHYNSKYESLETAVGHPDGLAVVGFLLETVDAPNPRFDRLVQGLEGIQKRESVMNVTSESLLWMDREDLQIGNYVTYKGSLTTPPYTECVTWIIYEKPVQIGSEQLGLLRQLEGPDSQPIERNVRPTQRHPPGHSVTYVKQVRSKL
         
首先通过SWISS-MODEL进行同源建模,结果显示家蚕碳酸酐酶的主要区域(25E-268K) 可以利用 Protein Data Bank中4ZX1模型为模板进行建模。

但是1M-24A以及269Q-274L 这两个区域缺少模板。因此 先通过SWISS-MODEL同源建模得到主体结构区域。1M-24A以及269Q-274L区域通过trRosetta进行非同源建模。随后利用本课题组自行开发的基于Modeller的穿针引线建模方法,将三个模板进行穿针引线拼接,得到家蚕碳酸酐酶模型
         
结构评估:Ramachandran plot用于描述蛋白质结构中氨基酸 残基二面角φ和平是否处于合理区域,可用于表征同 源建模结果的合理性。结果表明其完全允许区域(89.3%)与允许区域(10.3%),总和超过了99%,表明本研究所得的家蚕碳酸酐酶结构合理。

         
通过前人对与家蚕碳酸酐酶同种属的碳酸酐酶IX(PDB代号:4XZ1) 的研究表明,4ZX1的活性区域为62N~65S,89L~91Q,120L~122H,131V~143V,198L~206C。利用分子叠合技术对家蚕碳酸酐酶与4ZX1的蛋白结构进行叠合对比, 确定家蚕碳酸酐酶活性口袋的空间位置。通过蛋白序列进行比对分析, 得到家蚕碳酸酐酶的潜在活性口袋为:70N~72S(区域A),98F~100Q(区域B),128F~130H(区域C),138L~150V (区域),209L~217C (区域E)

         
         

4. 动力学模拟  

         
家蚕碳酸酐酶在100ns模拟过程中均方根偏差图

均方根偏差 (RMSD)分析可以揭示家蚕碳酸酐酶整体构象的稳定性。该结果显示, 在模拟的10ns, 家蚕碳酸酐酶的RMSD迅速从0nm上升至0.3nm随后在0.3nm~0.35nm左右波动。家蚕碳酸酐酶最后50 ns的RMSD值约为0.35 nm, 表明该酶的结构稳定。

家蚕碳酸酐酶在后50ns模拟过程中可及面积频数分布图
家蚕碳酸酐酶最后50 ns的平均可及面积为142 nm²。家蚕碳酸酐酶蛋白分子内平均氢键数 (HBN) 为181,家蚕碳酸酐酶与水溶液间的平均氢键数为587
         

5.  MM/PBSA分析  


在动力学分子模拟后,通过MM/PBSA法进一步分析对接模型的结合自由能,得到总结合能为-40.72 kJ/mol。其中对自由能的贡献主要是范德华力的相互作用-57.86 kJ/mol。而极性溶剂化21.39 kJ/mol, 对结合有显著的反作用。通过分析蛋白质氨基酸残基结合能得知家蚕碳酸酐酶对接后的模型中,分子间相互作用力主要存在于家蚕碳酸酐酶活性口袋中 的D、E区域。
         
         
结果:本文通过同源建模获得了一个良好的蛋白质结构模型,并通过分子模拟与分子对接技术探究其潜在活性位点与催化机制。建模所得的酶结构可靠性良好(完全允许区域为89.3%,允许区域10.3%,总和超过了99%);家蚕碳酸酐酶与底物的对接结合能为-6.1 Kcal/mol; 范德华力在家蚕碳酸酐酶和底物的结合中占主导地位,而极性溶剂化对结合有显著的反作用;家蚕碳酸酐酶与底物的相互作用的区域为:138L~150V和209L~217C; 同源建模所得的家蚕碳酸酐酶结构稳定(模拟最后50nsRMSD值约0.35nm)。该研究对后续进一步理性设计和改造家蚕碳酸酐酶提供了一定的理论支持。
         
更多基础知识可以参考我们的公众号文章:

一、分子模拟理论概述以及安装GROMACS

1、分子模拟微信群+160页GROMACS入门实验讲义-长期有效

2、蛋白质结构与动力学模拟的方法与工具概述

3、分子动力学模拟理论概述

4、分子动力学模拟的主要步骤

5、分子模拟基础-获取Gromacs软件

6、Ubuntu16编译安装Gromacs2020

7、Linux7.6编译安装Gromacs2018并行版

8、Gromacs在线示例教程

9、能在Windows上跑Gromacs模拟吗

10、Gromacs动力学模拟结果分析常见指标

11、Ubuntu下一条命令安装GROMACS软件

12、结构生物学和分子模拟相关专业书籍介绍

13、五种方式安装GROMACS分子模拟软件

14、使用bioconda一键安装gromacs


二、GROMACS分子模拟入门实验-全流程
GROMACS实验教程 (1)、运行环境准备
GROMACS实验教程 (2)、生成蛋白结构拓扑
GROMACS实验教程 (3)、检查和理解拓扑文件
GROMACS实验教程 (4)、定义容器并加水
GROMACS实验教程 (5)、为模拟体系添加离子
GROMACS实验教程 (6)、体系能量最小化
GROMACS实验教程(7-8)、nvt与npt平衡
GROMACS实验教程 (9)、进行正式动力学模拟
GROMACS实验教程(10)、模拟结果分析  
水中的溶菌酶GROMACS模拟入门简明步骤-v4


三、实验室生信服务器管理技能系列

1、生信IT基础技能1-批量操作Linux服务器
2、生信IT基础技能2-配置MySQL数据库服务
3、生信IT基础技能3-多台Linux共享公共数据
4、生信IT基础技能4-构建内网yum源服务器
5、生信IT基础技能5-把Docker用起来
6、生信IT基础技能6-搭建实验室或个人网站
7、生信IT基础技能7-搭建实验室的ftp服务器
8、搭建实验室gitlab代码库  

9、查看生信Linux服务器配置性能的实用命令


原文:

现代食品科技 Modern Food Science and Technology 2022,Vol.38,No.1现代食品科技,2022,38(1):159-164
CHEN Yinxi, LI Jingjing, LUO Jiawei, et al. Analysis of the structure and catalytic mechanism of carbonic anhydrase in silkworm byhomology modeling, molecular simulation and molecular docking techniques [J]. Modern Food Science and Technology, 2022,38(1):159-164
原文可自行下载。


参考文献
[1] Giuseppina De Simone, Claudiu T Supuran.(In) organic anions as carbonic anhydrase inhibitors [J]. Journal of Inorganic Biochemistry, 2012, 111:117-129
[2] PAN Li,ZHANG Shouwen, GU Keren. Research progress of enzyme application in food industry [J]. Cereals & Oils, 2016, 29(5):1-4
[3] WANG Ruiqin, CHEN Dezhao,  WEI  Shangsheng,  et  al. Research progress and application of enzyme in food industry[J]. China Condiment, 2019,44(4):184- 186
[4]  E  L  Jensen,  S  C  Maberly,  B  Gontero.  Insights  on  the functions  and  ecophysiological  relevance  of  the  diverse carbonic anhydrases in microalgae [J]. International Journal of Molecular Sciences, 2020, 21(8): 2922
[5]  Sizhu Ren, Shuhui Jiang, Xunyou Yan, et al. Challenges and opportunities:   porous supports in carbonic anhydrase immobilization[J]. Journal of CO₂Utilization, 2020, 42(1-2): 101305 等。

最新入群政策:本公众号建立了5个生信专业微信交流群:《生信工作职业交流群》《分子模拟分群》《生信分析-单细胞群》《R-Python编码群》《IT高级技术群》,由于广告骗子太多,需要加群的按需添加微信coding_gene,付费35元,选择加入任意多个群。

今天的分享就到这里了  

欢迎点赞、在看、分享转发朋友圈 ^.^ 公众号还可以“设为星标”喔~

生信实战
十年前你还不懂生信,看那一行行代码和报错,只是朦胧的心痛...