“ MaxQuant是基于质谱(Ms)的蛋白质组学数据分析最常用的平台之一,免费使用,目前认可度相对较高,可针对多种质谱数据格式(.raw、.wiff、.mzML、.mzxml),且内置了自己的肽段搜索引擎-Andromeda”
MaxQuant支持标记定量和非标定量,2.0版本后的MaxQuant还支持DIA的数据分析。MaxQuant具备非线性质量校正和Match Between Runs功能,可以增加蛋白鉴定数量和提高定量准确性。
接下来以TMT标记定量蛋白质组学数据为例,给大家展示一下MaxQunat软件的使用。
数据搜库之前需要准备好原始质谱数据以及物种的蛋白质fasta序列:软件搜库就是将质谱采集到的原始谱图数据和蛋白质序列数据库进行比对解析的过程。MaxQuant对物种全长蛋白质序列进行模拟酶切和碎裂,将蛋白质序列信息转换为理论谱图数据。通过将理论谱图数据与实际采集到的原始谱图数据进行比对打分,实现搜库。蛋白质序列可以去UniProt网站下载,或者其它数据库网站。
01
—
TMT标记定量蛋白质组学数据搜库过程
7. 之后进入“全局参数”模块;
8. “Sequence”—物种参考蛋白序列.fasta文件;
“Identification”—勾选"Match between runs"。由于缺失值的存在会削弱生物样本或实验条件之间真实定量差异的能力,Match between runs功能可以改善缺失值问题;
“Label-free quantification”—如果是非标定量则勾选iBAQ。iBAQ是基于Intensity的强度值,除以该蛋白的理论可被检测的肽段数目计算而来的定量值,主要用于不同蛋白的相互比较;
9. 在“Sequence”选项中点击“Add”导入物种参考蛋白序列.fasta文件;
10. 在选中序列文件情况下,点击“Taxomony ID”,输入物种拉丁文名称得到物种在Uniprot库的ID,或者输入ID得到蛋白序列所属物种拉丁名。
11. 之后进入“性能”模块,在左下角设置线程数,根据笔记本情况设置线程数,之后点击“开始”运行;
这个就是在Windows系统下的搜库分析,之后软件会默认在原始数据目录下生成结果。运行完成之后可以在“可视化”模块下查看搜库结果和对应谱图。
02
—
TMT标记定量蛋白质组学数据搜库结果
1. 在搜库结果中,mqpar.xml是搜库过程中所有参数配置文件,若想二次搜库或者想在“可视化”模块下再次查看结果,可在Maxquant左上角“加载参数”选项中直接导入mqpar.xml。
2. 搜库主要结果在combined文件夹下的txt子文件夹中,如图:
其中msms.txt、peptides.txt、proteinGroups.txt分别为谱图、肽段和蛋白结果文件。另外summary.txt文件记录了所有原始数据文件的总体信息;evidence.txt文件记录了已鉴定肽段的所有信息。tables.pdf文件是相关结果文件的说明文档。
03
—
鉴于蛋白质质谱数据通常较大,有时候在Windows系统里进行maxquant搜库会花费十几个小时,效率较低而且对笔记本硬件要求较高。有条件的可以去linux系统服务器上使用MaxQuant进行搜库分析
Linux系统中安装MaxQuan操作笔记:https://www.omicsclass.com/article/2245
脚本运行示例:
mono MaxQuantCmd.exe mqpar.xml
在Linux中mqpar.xml配置文件不太好生成,最简单的方法就是在Windows系统Maxquant下设置好参数,之后点击“保存参数”得到mqpar.xml文件,再上传到服务器上。
注意文件上传之后需要对文件中原始质谱数据文件和蛋白序列的路径进行更改,改成数据在服务器上的绝对路径:
之后放到后台运行命令行即可。
扫描下方二维码了解更多生物信息视频课程: