GROMACS分子模拟基础实验教程(10)-模拟结果分析

文摘   科学   2023-05-28 17:48   江苏  

         


         

【链接】最新联系方式以及加入微信交流群



这是入门实验的最后一节,之前的1-9参考:


GROMACS分子模拟基础实验教程(1)-运行环境准备
GROMACS分子模拟基础实验教程(2)-生成蛋白结构拓扑
GROMACS分子模拟基础实验教程(3)-检查和理解拓扑文件
GROMACS分子模拟基础实验教程(4)-定义模拟体系的容器尺寸并加水
GROMACS分子模拟基础实验教程(5)-为模拟体系添加离子
GROMACS分子模拟基础实验教程(6)-体系能量最小化
GROMACS分子模拟基础实验教程(7-8)-nvt与npt平衡

GROMACS分子模拟基础实验教程(9)-进行正式动力学模拟


今天是:GROMACS分子模拟基础实验教程(10)-模拟结果分析      

第10步-分子动力学模拟结果分析  

完成模拟之后,就到了最重要的部分:数据分析,也是我们模拟的目的。如果分析的结果不那么理想,还得回头进行模型或模拟参数调整,重新建模或者模拟。

其实根据模拟的结果,可以分析的指标很多(具体可以参照gromacs官方手册),我们参照这个基础实验,先学习一些基础的入门分析。
模拟后的文件参考如下:


-rw-rw-r-- 1 asp asp    10865 May 24 22:36 mdout.mdp-rw-rw-r-- 1 asp asp  1301288 May 24 22:36 md_0_1.tpr-rw-rw-r-- 1 asp asp   815052 May 24 23:53 md_0_1_prev.cpt-rw-rw-r-- 1 asp asp   815052 May 24 23:53 md_0_1.cpt-rw-rw-r-- 1 asp asp 12524284 May 24 23:53 md_0_1.xtc-rw-rw-r-- 1 asp asp  2337499 May 24 23:53 md_0_1.gro-rw-rw-r-- 1 asp asp    69912 May 24 23:53 md_0_1.edr


         

10.1、trjconv优化轨迹 


第一个工具处理模块是trjconv, 这是一个后处理工具, 用于处理轨迹中的坐标、去除周期性边界条件、还可以手动调整轨迹的时间单位和帧频率等。这里我们使用trjconv来处理体系中的周期性边界问题(在模拟的过程中,蛋白质在晶胞中扩散运动的过程中,可能看起来会出现“断裂”或“跳跃”到体系的另外一边的情况
         
使用下面的工具来进行处理:
gmx trjconv -s md_0_1.tpr -f md_0_1.xtc -o md_0_1_noPBC.xtc -pbc mol -center

         
         
根据提示选择对应的编号:
Select 1 ("Protein") as the group to be centered and 0 ("System") for output
完成后,生成md_0_1_noPBC.xtc,我们将基于这个数据进行后续的数据分析

10.2、计算RMSD与分析   
RMSD的统计学意义Root Mean Square Deviation,均方根偏差,模拟中计算这个值主要是为了衡量模拟过程中结构波动情况。
         
可以先看看模拟结构的稳定性,Linux下执行:

gmx rms -s md_0_1.tpr -f md_0_1_noPBC.xtc -o rmsd.xvg -tu ns

根据提示进行选择:         
Choose 4 ("Backbone") for both the least-squares fit and the group for RMSD calculation
-tu 选项设定输出结果的时间单位为ns, 即便轨迹文件以ps为单位输出的。主要是为了使得输出文件更清晰(比如当模拟时间很长时, 100ns的比例间隔大一点,显示起来比起100000ps更美观一点)。
         
完成后生成了rmsd.xvg,使用命令查看:
xmgrace rmsd.xvg

         
大概在0.05ns达到稳定状态后,整体波动性范围在0.075左右,波动比较小,可以认为是比较稳定的。
         
如果想计算相对于模拟之前晶体的结构差异,可以使用下面的命令:
gmx rms -s em.tpr -f md_0_1_noPBC.xtc -o rmsd_xtal.xvg -tu ns

也是选择4 ("Backbone")
可以把两个RMSD拟合一下查看:
xmgrace rmsd.xvg rmsd_xtal.xvg

         

上面两个图都显示出RMSD大约是0.1nm, 这表示蛋白质的结构非常稳定。
红色曲线是原来晶体的,黑色曲线是模拟后的。
         

10.3、gyrate计算回旋半径Rg 

蛋白质的回旋半径Rg可衡量其紧密程度,如果蛋白质的折叠很稳定, 其回旋半径Rg将保持一个相对稳定的值。如果蛋白质去折叠, 那么它的Rg将随时间变化。

Linux执行:

gmx gyrate -s md_0_1.tpr -f md_0_1_noPBC.xtc -o gyrate.xvg


选择group 1 (Protein)
执行完成后新生成了gyrate.xvg
然后查看图形执行:
xmgrace gyrate.xvg


         
         
从这个图可以看出Rg值基本不变,总体在1.41nm和1.43nm左右,这说明在温度为300K时, 1ns的时间内,蛋白质整体结构比较稳定, 处于紧密折叠的状态。(注意我这个图的纵坐标间隔是比较小的,看起来波动大,实际上数字波动范围比较小)。

         

当然这些只是基础入门分析,对于蛋白质结构或模拟体系,我们还可以分析很多指标,如:通过PCA主成分分析主要的动力学特性、通过Dynamite做大尺度协同运动分析、DynDom动态结构域分析、分析溶剂可及性表面面积、氢键的数量、范德华接触数量、二级结构元件数量、RMSF等等……根据实际研究对象进行选择和分析。

         

以上只是实验环境例子,仅供学习参考。如发现相关不当之处或有疑问问题,欢迎联系共同探讨学习。

          

更多实验前的基础准备,可以参考如下链接:

基础准备1-分子动力学模拟理论概述

基础准备2-分子动力学模拟的主要步骤

基础准备3-分子模拟基础-获取Gromacs软件

基础准备4-Ubuntu16版Linux下编译安装Gromacs2020

基础准备5-Linux7.6编译安装Gromacs2018版并行版

       

今天的分享就到这里了  

欢迎点赞、在看、分享转发朋友圈 ^.^ 公众号还可以“设为星标”喔~


【链接】最新联系方式以及加入微信交流群

  

生信实战
十年前你还不懂生信,看那一行行代码和报错,只是朦胧的心痛...