蛋白质组学分析深度指南|（1）蛋白质的鉴定

学术 2024-11-14 18:05 广东

蛋白质是细胞内执行绝大多数生物功能的直接分子，因此蛋白质组学能够直接反映细胞当前的状态和活动。如果说转录组研究是在告诉我们可能发生了什么，那蛋白质组学则展示了实际正在发生的事情。

蛋白组与其他组学的区别：

√ 基因组学：基因组学研究DNA序列，它提供了生物体的遗传蓝图，但并不直接反映蛋白质的表达水平和功能状态。基因表达调控复杂，不是所有基因都翻译成蛋白质，且一个基因可产生多个蛋白质变体。

√ 转录组学：转录组学关注mRNA水平的变化，是基因表达的一个中间步骤。然而，mRNA水平并不总是与蛋白质水平完全对应，因为存在转录后调控和翻译调控。

√ 代谢组学：代谢组学研究代谢物，它是细胞活动的最终产物。代谢组学可以提供细胞状态的快照，但无法直接揭示产生这些代谢物的蛋白质。

在PubMed搜索“Proteomics”相关的文献，可以看到，自1992年来，蛋白质组学的研究呈现逐年上升的趋势。近几年，蛋白组以每年一万多篇的速度发表着。对这些文献的研究领域热度进行识别，可以看到它们涵盖了微生物、植物、医学等诸多领域，随着技术的进步，蛋白质组学在理解疾病机制、发现生物标志物、开发新疗法等方面显示出巨大的潜力，成为推动精准医疗和个性化治疗的关键工具。

要做蛋白质组，首先要选择合适的蛋白质谱技术，在之前的推文当中，我们也多次介绍过目前市面上常见的蛋白质谱技术的原理（蛋白质谱定量技术又成长了——TMT pro；蛋白质谱定量技术又成长了——Direct DIA），随着技术的不断改善，dDIA（direct Data-independent acquisition），与传统DIA分析策略相比，无需进行DDA分级建库，利用机器深度学习，实现直接通过搜索DIA原始文件谱图生成库，鉴定到的蛋白数目与传统DIA的差距也越来越小，在处理复杂样品和大规模蛋白质组学实验中凸显出显著优势。

得到数据后，我们要做的下游数据处理都是大同小异的。这个流程图展示了蛋白质组的常见分析流程：

接下来这个系列的微信文章，我们就讲围绕蛋白质组的这些分析方法进行逐一讲解。今天这篇文章就先开个头，讲讲蛋白质组数据处理的第一步：蛋白质鉴定（定性）。

蛋白质鉴定（定性）是蛋白质组学研究的核心内容之一，其中，数据库搜库是蛋白质组学中用于鉴定肽段和蛋白质的关键步骤。通过将质谱实验中获得的肽段质谱图与理论质谱图进行比对，可以确定肽段的序列，进而推断出蛋白质的身份。

数据准备

首先，使用质谱仪对样品进行分析，生成原始谱图数据文件。同时，选择合适的蛋白质序列数据库，如Uniprot或NCBI，该数据库应包含目标物种的所有已知蛋白质序列，以供后续比对使用。

数据预处理

接下来，对原始数据进行去噪、峰检测和峰匹配，以提高数据质量和识别潜在的肽段离子。此外，如果实验中使用了iRT标准肽段，还需进行保留时间校正，确保肽段的保留时间一致性，提高数据的可靠性和可比性。

补充知识：“什么是iRT质控？”

在基于质谱的蛋白质组学研究中，肽段的保留时间（Retention Time, RT）是鉴定和定量的关键参数之一。然而，由于仪器的不稳定性和实验条件的变化，RT会发生漂移，这将严重影响数据的一致性和准确性。为了解决这一问题，iRT（Internal Retention Time Standard）质控被引入到实验中，通过校正RT偏移来提高数据的可靠性。

原理：iRT标准肽段是一组已知保留时间的标准肽段，它们在每次实验中与样品肽段一同分析。这些标准肽段的RT在不同实验中保持恒定，可以用来校正样品肽段的RT偏移。通过将样品肽段的RT与标准肽段的RT进行比较，可以计算出校正因子，从而校正样品肽段的RT。

肽段鉴定

根据蛋白质序列数据库生成所有可能的肽段序列及其理论碎片离子，然后将质谱仪采集的实验谱图与这些理论谱图进行比对。通过打分函数评估匹配的质量，并使用FDR（False Discovery Rate）控制，通过引入反向数据库来减少假阳性结果，确保鉴定的可靠性。

蛋白质组装

将鉴定出的肽段归属于相应的蛋白质，形成蛋白质组。再次进行FDR控制，确保蛋白质鉴定的可靠性。

常用软件：

Mascot：

Mascot 是一款经典的蛋白质鉴定软件，被广泛应用于质谱数据的检索和分析。它支持多种检索算法，包括肽指纹图谱（PMF）、串联质谱检索（MS/MS Ion Search）和序列查询（Sequence Query），能够处理来自不同质谱仪的数据。Mascot 的核心优势在于其特有的基于随机匹配概率的打分方法，支持标准统计显著性检验和FDR阈值选项，确保鉴定结果的高可靠性。

MaxQuant：

MaxQuant 是一款免费且功能强大的蛋白质组学分析软件，它内置了自己的肽段搜索引擎Andromeda，支持多种质谱数据格式，包括标记定量和非标定量。它的主要优势在于其非线性质量校正和Match Between Runs功能，这些功能显著提高了蛋白质鉴定的数量和定量的准确性。此外，MaxQuant 支持DIA数据的分析，使其成为处理复杂蛋白质组学数据的强大工具。

Spectronaut：

Spectronaut 是一款专门用于DIA数据分析的软件，支持多种质谱仪生成的数据文件格式，并且内置了iRT校正功能，能够自动校正保留时间偏移，提高数据的一致性和准确性。Spectronaut 的主要优势在于其高效的肽段鉴定和蛋白质组装算法，能够处理大规模样本的数据，提供详细的质控报告和统计分析结果。Spectronaut在dDIA模式下无需依赖DDA建库，可以直接从DIA原始数据中提取和匹配谱图，简化了实验流程，提高了分析的效率和准确性。它适用于高通量的蛋白质组学研究，能够处理大量数据，提供可靠的结果。

总结

蛋白质组学中的蛋白质定性（鉴定）可以说是进行蛋白质组分析的第一步，也是必不可少的一部，它涉及从数据校正、搜库以及数据质控等多个环节。iRT质控通过校正保留时间偏移，确保数据的一致性和准确性；数据库搜库通过比对实验数据与理论数据，确定肽段和蛋白质的序列；数据质控通过多方面的质量控制措施，确保实验结果的可靠性。常用的软件工具如Mascot、MaxQuant、Spectronaut等为蛋白质组学研究提供了强大的技术支持，使得我们能够更高效地进行数据处理和分析。

参考文献

[1] Mehta D, Scandola S, Uhrig R G. Direct data-independent acquisition (direct DIA) enables substantially improved label-free quantitative proteomics in Arabidopsis[J]. bioRxiv, 2020.

[2] Kim, Y. J., Chambers, A. G., Cecchi, F., & Hembrough, T. (2018). Targeted data-independent acquisition for mass spectrometric detection of RAS mutations in formalinfixed, paraffin-embedded tumor biopsies. Journal of Proteomics, 189, 91–96.

最新文章

蛋白质组学分析深度指南|（1）蛋白质的鉴定

通过一篇文章掌握多个微生物组应用方法

如何轻松完成论文或PPT所需的科研插图？

【直播开讲】非靶还是靶向？代谢组学多样化该如何选择？

2024神经科学最前沿！

年末突击转录组学习，培训报名正式开始啦

如何进行“转录组+其他组学”联合分析？

仅有16S/ITS结果，能对微生物功能进行研究吗

客户文章 | Cancer Cell | 如何通过单细胞转录组进行肿瘤生物标志物研究

【距开课3天】单细胞培训下周正式开讲

如何玩转“代谢组+”多组学联合分析？

如何使用单细胞助力医学研究？

【倒计时3天】单细胞培训即将截止报名

基迪奥生物邀您参会|中国遗传学会2024全国学术研讨会正式开幕

Nature等顶刊文章是如何进行单细胞分析的？

轻松玩转转录组+翻译组关联，冲刺高分！

实用干货 | 如何依靠差异来初步分析转录组数据？

基迪奥生物邀您参会|中国微生物学会学术年会正式开幕

其实细胞周期分析也可以是拟时分析！

空间转录组：突破细胞微环境研究困境之术

单细胞培训提醒您，前方报名倒计时

如何获得背景干净的科研照片？

分享6篇最新的时空组学顶刊文章

来看看大佬们的最新单细胞文章怎么发！

看小小物种努力闯关成为Biomarker

研究植物转录调控，你不能不知道的数据库

用捕鱼者的思维来解决富集分析的问题

如何通过细胞通讯分析研究不同领域的生物学问题？

【直播开讲】宏基因组整体概况与关键应用点介绍

如何进行“单细胞转录组+代谢组”联合分析？

基迪奥生物Q3项目文章大盘点

如何进行植物转录组分析？

WGCNA怎么做？利器出手，挖掘核心模块与基因！

单细胞转录组如何重塑植物发育研究？高分通关秘籍在这里！

实用干货 | 转录组差异分析常见问题解答

《单细胞转录组数据分析入门教程》免费领！

【直播开讲】转录组＋代谢组如何发好文

5天时间入门单细胞组学，都能学到什么？

如何查找互作蛋白？

如何进行植物抗逆研究？超强工具分享！

单细胞转录组拟时分析知多少？

快来查收这份宏基因组环境因子通关攻略

终于加场了，单细胞培训班报名开启，这次不能再错过！！！

【直播开讲】单细胞转录组在医学领域应用

实用科研工具与使用教程分享

假期快要结束！！满满的干货——细胞通讯分析软件比较和总结

常用生信图表代码示例全部可COPY！

自查，做GO富集分析时你是不是也遇到过这些问题？

50分文章的差异标记散点图如何绘制？

生信写作必备Top图表榜单，无痛速绘财富密码

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉