蛋白质分析常用流(tao)程(lu)

文摘   科技互联网   2024-10-10 09:06   江苏  
作为生命活动的物质承担者,蛋白质的研究可以说是一套基本功了,本文主要以本文就以SNase为例,大家记录一下之前开组会时我介绍过的从编码信息一直到三维结构的蛋白分析流程(有炒冷饭之嫌😂)。下文中提到的所有工具与文件都存在:https://pan.baidu.com/s/1P3BOjyje9du2iuAbArpehg 提取码:uooa。感兴趣的读者可以自己下载练手。
具体步骤:
1、蛋白质编码序列的获得:这是我们这一系列操作的原点,关于核酸序列获取,可以来自于各位先前的科研研究对象(自己的测序数据),或者是初探一下将来的研究对象(Genbank等数据库中的数据),本文的SNase便是本课题组涉及过的一种核酸酶。再Pubmed里是可以直接下载氨基酸序列的,若各位是通过RNA测序等方式得到cDNA序列,则可以通过Editseq软件(附件中为大家提供了安装包)从中寻找ORF并翻译为氨基酸序列(具体操作见下面的视频)结果如下图所示。



2、理化性质预测:其实细心的读者从上图中就可以发现Editseq在给出氨基酸序列时,就会同时给出一些预测的基本理化性质,如等电点、氨基酸组成等。但是显然,我们有更专业的选择——ExPASy ProtParam tool(全称为Expert Protein Analytic System,大家可以自行体会一下,网址为https://web.expasy.org/protparam/)。这个网站的操作也是非常的简单,只需将我们刚才所得到的单字符氨基酸序列粘贴在网站的程序窗口内点击Compute parameter即可开始运算。运算结果如以下两张图片所示,我们可以从中得知SNase共有171个氨基酸,相对分子质量为19122.66,理论等电点为9.28,消光系数为17420,在人类网状红细胞、酵母、大肠杆菌中的半衰期分别为30h、20h、10h,不稳定指数为29.01,亲脂性系数为63.92,亲水性为-0.898。



3、二级结构预测:同样的,关于二级结构的预测也有相应的在线平台:SOPMASECONDARY STRUCTURE PREDICTION METHOD(

https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html),在简单的输入序列之后便可运行得到如下的结果,该平台会使用不同的颜色标记序列中每一个氨基酸所属的二级结构(如α-螺旋、β-折叠等)。



4、跨膜结构域预测:这一部分我推荐使用在线平台TMHMM 2.0(https://www.sogou.com/link?url=DSOYnZeCC_p2w9ORQfL6wLMD76sWJ1536q_W7QFAUZsPiTRg4f7kMw..),依然是一个可以一键式操作的网站。SNase的运行结果如下图所示,我们从结果中可以看出SNase是不具有跨膜结构域且其全长均是属于Outside的一个状态,因此我们可以初步推测其为一种分泌蛋白,既然是分泌蛋白,那我们就有必要进一步的找寻其信号肽的结构。


5、信号肽预测:这里推荐大家使用SignalP-5.0,也是一款很好用的在线网站,可以通过预测结果中的C值:原始剪切位点分值,Y:综合剪切位点分值,S:信号肽剪切位点分值来判断是否有信号肽的存在。显然,SNase是不具有信号肽的。【一般综合剪切位点分值(Y)与信号肽剪切位点分值(S)较低(< 0.5)即是无信号肽】



6、保守结构域:这里可以使用我们之前文章中提到过的NCBI的CD-Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)进行预测。从CD-Search预测的结果中可以得到保守结构域的功能、序列范围、E值、参考文献等信息,我们可以得知SNase具有降解核酸(DNA/RNA)的功能。


7、三维建模:这一步需要的步骤与时间就会相对多一些了,首先我们需要用CPHmodels(http://www.cbs.dtu.dk/services/CPHmodels/)在线建模(这一网站是利用同源建模的方法构建目标蛋白模型,一般认为序列相似度高于30 %的蛋白序列可以用作同源建模的模板)得到pdb文件。pdb文件是一种三维的文件,其中包含了各个原子的坐标信息,需要用Pymol(一种基于Python语言的pdb编辑器)来打开与编辑(Pymol的安装包也在附件里提供给大家了)。使用Pymol打开pdb后的窗口如下所示,红色箭头指出来的是GUI窗口可以用于编辑命令,黄色箭头指出来的是按钮界面,不习惯使用命令行的同学可以使用按钮操作。

以下是一些具体的代码供大家参考:

show sticks     #展示球棍模型hide sticks     #隐藏球棍模型show sphere     #额,下面的这些展示形式不太能翻译好,大家可以自己敲一下感受一下hide sphereshow meshhide meshshow dotshide dotscolor blue, ss h   #将α-螺旋部分转换为蓝色color yellow,ss s  #将β-片层部分转换为黄色color red,ss 1+""  #将loop与其他结构转换为红色set cartoon_flat_sheets,数字  #改变片层的厚度set cartoon_oval_width数字    #改变宽度set cartoon_oval_lenth,数字   #改变长度

欢迎致谢

如果以上内容对你有帮助,欢迎在文章的Acknowledgement中加上这一段,联系客服微信可以发放奖励:

Since Biomamba and his wechat public account team produce bioinformatics tutorials and share code with annotation, we thank Biomamba for their guidance in bioinformatics and data analysis for the current study.

欢迎在发文/毕业时向我们分享你的喜悦~


已致谢文章:
13分+文章利用scRNA-Seq揭示地铁细颗粒物引起肺部炎症的分子机制
IF14.3| scRNA-seq+脂质组多组学分析揭示宫内生长受限导致肝损伤的性别差异
鼻咽癌的Bulk RNA-Seq与scRNA-Seq联合分析
除了铁死亡,还有铜死亡?!
银屑病和脂肪肝病中共同病理和免疫特征


文章的最后,放几张笔者修饰好的SNase三维结构图:

如何联系我们

公众号后台消息回复不便,这里给大家留一下领取资料及免费服务器(足够支持你完成硕博生涯的生信环境)的微信号,方便各位随时交流、提建议(别问在么,添加时直接说来意)。此外呼声一直很高的交流群也建好了,欢迎大家入群讨论:

永久免费的生信、科研交流群

大家可以阅读完这几篇之后添加
给生信入门初学者的小贴士
如何搜索公众号过往发布内容

您点的每个赞和在看,我都认真当成了喜欢


Biomamba 生信基地
本人为在读博士研究生,此公众号旨在分享生信知识及科研经验与体会,欢迎各位同学、老师与专家的批评指正,也欢迎各界人士的合作与交流。
 最新文章