首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
Nature Reviews Methods Primers|Top-Down 蛋白质组学
文摘
2024-06-20 17:20
广东
大家好,本周为大家带来一篇在
Nature Reviews Methods Primers
上的文章,
Top-Down Proteomics
[1]
,文章的通讯作者是美国威斯康辛大学麦迪逊分校化学系的
Lloyd M. Smith
和
Ying Ge
教授。
文章介绍了
Top-Down
蛋
白质组学的基本工作流程、应用以及面对的挑战。
在生物学的中心法则中,信息从
DNA
流向
RNA
,最终转化为执行生物学功能的蛋白质。由于遗传变异、
RNA
可变剪接和翻译后修饰(
PTMs
)的存在,蛋白质形成了多样的蛋白分子形式(
proteoforms
)。目前,
Top-Down
蛋白质组学(
TDP
)已经成为了全面研究蛋白分子形式的最强大技术,它通过
Top-Down
质谱(
TDMS
)的实验,不需要酶切,直接分析完整的蛋白质,以提供蛋白分子形式的整体视图。
TDMS
既需要对完整蛋白的精确质量分析(
Top
),也需要控制下游气相离子的碎裂来获取序列的信息和
PTMs
的位点(
Down
)。与
TDP
不同,
Bottom-Up
蛋白质组学(
BUP
)通过分析酶切后的肽段(通常小于
3 KDa
)来获取蛋白质的信息,由于多肽相对于完整蛋白更加容易分离、电离和断裂,
BUP
有着比
TDP
更加广泛的应用。但是由于
BUP
获取的肽段数量有限,因此提供的序列覆盖普遍偏低,这就导致了蛋白分子形式信息的丢失。此外,相较于
TDP
来说,
BUP
无法提供组合的
PTMs
信息。(
如图
1
)
图
1. TDP
和
BUP
的对比
TDP
的基本实验流程
如图
2
所示,包括前端样品制备和分离,完整质量分析和碎片分析,以及关于蛋白分子形式的鉴定表征和定量的信息学。
图
2. TDP
的基本工作流程
样品制备
传统
的
蛋白质提取方法使用
Good’s
缓冲液,它具有高盐浓度
(>100 mM)
,蛋白酶
抑制剂、
磷酸酶抑制剂和表面活性剂,用于总蛋白质的溶解。这些常规试剂往往与
TDP
不相容,因为它们会干扰蛋白质离子检测并抑制质谱信号。
不相容的盐和小分子可以通过
超滤管离心
或使用尺寸排除色谱
(SEC)
自旋柱去除。
在样品制备过程中应注意尽量减少人工引入的蛋白分子形式。例如,蛋白酶和磷酸酶抑制剂通常包括在萃取缓冲液中,以尽量减少体外蛋白质降解和去磷酸化。蛋白应该低温保存,以减慢任何的修饰反应。表面活性剂能促进疏水膜蛋白的细胞渗透和增溶,但是表面活性剂会对蛋白的质谱分析造成信号抑制。蛋白质沉淀法通常使用氯仿
/
甲醇混合物或丙酮,可以去除表面活性剂和其他质谱不相容的污染物。然而,蛋白质沉淀方法耗时且可能导致蛋白质损失、实验变异性或溶解性问题。因此,可切割表面活性剂已被开发出来,如可酸降解的
Rapigest
、
ProteaseMAX
、
MaSDeS
;可光降解的
4-
己基苯基偶氮磺酸酯;可氧化还原降解的
N-
十二烷基二硫
-
β
-d-
麦芽糖苷等。
样品分离和富集
前端分离和富集策略可以选择性地分离亚蛋白质组,在质谱分析之前从复杂的生物样品中捕获和富集低丰度蛋白质
。
例如,可以通过差速离心的方式获取细胞器,蛋白再从细胞器中提取。另一种方式是通过亲和纯化的方式,基于抗体的方式已经在完整蛋白的靶向分析上得到了应用,但是该方法受到高特异性和高质量抗体需求的限制。为了解决这些挑战,可特异性捕获蛋白的表面功能化的多价超顺磁性纳米颗粒和集成纳米蛋白质组学的方法被开发出来。
仪器
早期的
TDP
实验依靠单四极杆和三四极杆
(
分别为
Q
和
QqQ)
质谱仪进行完整蛋白分析。这些系统具有较差的质量分辨能力,使得电荷状态测定困难,并且有限的质量电荷比
(m/z)
范围导致对大蛋白质的适用性较低。
高质量分辨能力对于
TDP
尤为重要,因为完整蛋白质产生的片段离子可以产生卷曲的质谱,其中具有不同电荷态的各种离子可以部分重叠。许多现代质谱仪器可以可靠地实现高分辨率,包括傅里叶变换质谱系统,如离子回旋共振
(FTICR)
和
Orbit
rap
质谱仪,以及飞行时间
(TOF)
和四极杆
-
飞行时间
(Q
-
TOF)
仪器
。
完整蛋白的分离
蛋白质组的复杂性给
TDP
带来了巨大的挑战,需要在质谱分析之前分离完整的蛋白质。当处理较大的蛋白质
(≥30 kDa)
时,这一挑战尤其明显,因为随着蛋白质大小的增加,
ESI
质谱中的离子信号迅速减少
。早期的分离方法使用凝胶电泳技术,例如二维凝胶电泳分离、虚拟的二维凝胶电泳分离、直接利用
MALDI MS
的干胶法和
PEPPI-MS
等
。还可以通过
SEC
(尺寸排阻色谱)、
RPLC
(反相液相色谱)、
HIC
(疏水相互作用色谱)、
IEX
(离子交换色谱)以及多维的
LC
方法来分离。例如一个
3D LC
方法,通过耦合
HIC - IEX - RPC
,相较于
2D IEX -RPLC MS
将蛋白质的鉴定数目提高了
14
倍。此外,
CE-MS
的最新进展可以用于变性和非变性的
TDP
分离。离子淌度质谱(
IMS
)是基于分子在电场作用下的气相运输性质和碰撞截面积(
CCS
)分离蛋白质,高分辨率的
IMS
已被证明可以用于分离高序列同源性的蛋白。
串联质谱技术
串联质谱(
MS/MS
)技术,在
TDP
中通常包括通过选择前体蛋白离子,将其解离成更小的片段离子并分析片段离子,从而得出蛋白质的初级结构和修饰(
如图
3a
)。有多种活化
/
解离方法可用于生成产物离子。大多数仪器可以进行碰撞诱导离解
(CID)
,也称为碰撞激活离解,通过与中性气体分子
(
如氮气或氩气
)
相互作用的碰撞激活来产生
b/y
离子
(
图
3b
)
。红外多光子解离
(IRMPD)
涉及吸收低能红外光子产生
b/y
离子,并可能在吸收多光子后产生二级和高阶片段离子,从而产生更广泛的蛋白质序列信息。基于电子的解离方法(
ExD
),如电子捕获解离(
ECD
)和电子转移离解
(ETD)
,在产生高序列覆盖率方面往往优于
CID
。
ExD
产生的
c/z
产物可用于确定的蛋白质形态表征和
PTM
定位。使用
193 nm
或
213 nm
激光,紫外光解离(
UVPD
)可以生成更复杂的串联质谱,序列覆盖率与
ExD
方法相当或更高。此外,结合四极质量过滤器、线性离子阱和
Orbitrap
的混合平台可以进行质子转移电荷还原(
PTCR
),以简化产物离子谱。
图
3. a,
串联质谱技术示意图。
b,
不同解离方式产生的碎片离子。
数据采集
可采集的谱图数量取决于仪器的占空比和峰的宽度。最常见的
TDP
数据采集方法是数据依赖的采集(
DDA
)。在
DDA
中,收集一个完整的质谱扫描,并选择几个前体离子(通常是最丰富的)进行片段化。与数据非依赖的采集(
DIA
),即不分离前体离子的质谱扫描碎片,正在迅速发展并在
BUP
工作流程中采用,为
TDP
提供了令人兴奋的机会。
结果处理
TDP
的数据信息丰富但是解析难度大,考虑到同位素和电荷态的影响,以及人类蛋白质组的高动态范围,使得谱图分析和对于低丰度蛋白的检测更加困难。
TDP
的谱图往往有更加复杂的同位素包络,通常不会观察到单同位素峰。大多数工具依赖于
Averagine
模型来解同位素并预测理论同位素分布。当谱图不能进行同位素分解时,谱图去卷积可以使用多个电荷态离子来推导出一种蛋白分子形式的平均质量。
目前正在开发用于存储质谱数据的标准化文件格式。最通用的文件格式是
mzML
(最新版本
1.1.1
),这是一种由人类蛋白质组组织蛋白质组学标准倡议
(HUPO-PSI)
支持的
XML
格式。几个开源软件库可以转换,读取和写入质谱文件格式,包括
ProteoWizard
,
JmzML
,
mzJava
和
pymzML
。
获得去卷积谱图后的下一步是针对蛋白质或蛋白质序列数据库搜索去卷积质谱,以识别具有错误发现率
(FDR)
控制的蛋白分子形式并表征
PTMs
,具体的搜索原理的概述可以查看原文
Results-data analysis
部分,在这里不再赘述。最后,定量分析不同样品间丰富度的差异。数据库可以使用来自
UniProt
、
RefSeq
、
GENCODE
或相关资源的蛋白质序列数据库。这些数据库只包含序列,不包含
PTMs
的信息。可以根据
PTMs
位点和类型,构建可用的数据库,但要注意限制
PTMs
的可变数目,否则产生的组合数据会过于庞大。
DNA
或
RNA-seq
数据可用于构建具有样品特异性基因突变和备选剪接事件的蛋白分子形式序列数据库。
定性与定量分析
TDP
提供了对
蛋白分子形式
的全面了解,使鉴定、新
蛋白分子形式的
发现和深入的序列表征成为可能。
TDP
具有独特的优势,因为它可以表征组合
PTM
s
与多基因家族中不同基因编码的同型异构体,这些异构体通常具有高序列同源性
。例如,肉瘤蛋白具有多种亚型和
PTMs
,如
N
端二甲基化、乙酰化、磷酸化和甲基化。单个肌肉细胞的蛋白质形态变化可以通过
TDP
进行研究。当单个蛋白分子上存在多个
PTMs
时,
TDP
是唯一可以解析复杂蛋白形态和组合
PTMs
的技术。例如,
TDP
可以鉴定组蛋白的多种蛋白分子形式,以及定量描述
PTMs
之间的化学计量学。
TDP
的定量方式和
BUP
类似,主要有非标记定量(
label free
):采用不同蛋白分子形式的信号强度定量;同位素标记(
isotope labeling
)
:
采用不同分子量的同位素标记来定量;化学标记(
chemical labeling
):采用化学报告基团来定量,尤其是在
MS
2
水平上
。
(如图
4
)
其他标记技术
——如氨基酸稳定同位素标记
(SILAC)
、同量异位(
isoabric
)标记、假同量异位(
pseudoisobaric
)标记和
NeuCode SILAC
——已经显示出定量
TDP
的潜力。
图
4.
不同定量方法
统计学分析和错误率计算
TDP
的软件通常会使用
E
值和
P
值来反映串联质谱和蛋白分子形式的匹配程度,此外
FDR
值也常被用来描述鉴定的可靠性。对于定量的
TDP.
对于定量
TDP
分析,统计分析通常使用单向方差分析和
Stundent
’
s
检验
(
双尾
)
。多次测试调整通常使用
benjamin - hochberg
方法进行。如有必要,可采用非参数
Kruskal-Wallis
单因素方差分析和
Wilcoxon
秩和检验进行组间比较。对于人类临床样本的定量
TDP
,随机截距的线性混合效应模型可以进一步表征人类个体之间的异质性。作者还介绍了一些
TDP
软件,例如,
TopPIC
、
MSPathFinder
、
TopMG
和
pTop
等。
应用
作者在这一部分列举了许多相关研究,考虑到篇幅限制,感兴趣的读者可以在原文中的
Application
部分查看。主要包括(
1
)全球蛋白分子形式的
发现
。(
2
)癌症:例如,一项全球
TDP
研究从结直肠癌细胞的
2332
种蛋白质中鉴定出
23000
多种蛋白分子形式,并揭示了转移性和非转移性细胞之间蛋白分子形式水平的巨大差异。(
3
)心血管疾病:将蛋白质组学应用于心脏生物学和临床诊断已经取得了进展。例如,
TDP
分析了“
CARDIA
研究”中的配对血清样本,揭示了载脂蛋白
AI
和
AII
与心脏代谢指标之间的蛋白分子形式特异性关联。(
4
)神经退行性疾病:失调的
PTMs
可以影响神经退行性疾病中的蛋白质聚集,许多
PTMs
是神经退行性疾病中蛋白质病变的调节剂。例如,阿尔茨海默病受到β或
tau
淀粉样蛋白磷酸化和β淀粉样蛋白中异天冬氨酸形成的影响。(
5
)传染病。(
6
)生物制剂:例如单克隆抗体,抗体偶联药物等基于蛋白的药物。(
7
)临床
TDP
,例如,使用
MALDI-TOF-MS
鉴定病原体,它可以直接从完整的细菌细胞表面快速检测到蛋白分子形式。
重现性与数据存储
TDP
是一个相对较新的领域,与成熟的
BUP
方法不同,普遍接受的实验方法和数据报告标准尚未制定。由
CTDP
(
Consortium for TDP
)
领导的标准化工作
正在
推动实验室间的比较,以更好地了解挑战并提高
重现性。蛋白分子形式易受样品处理和仪器方法变化的影响,因此科学的严谨性和充分的数据报告实践非常重要。
所有
TDP
数据都应公开提供。许多期刊已经实现了这一要求,但这需要
共同
的努力来确保正确的数据处理和报告实践得到执行。
CTDP
的
Proteoform Repository
为科学家提供了一个独特的中心,可以浏览
存储的蛋白分子形式
并提供
TDP
数据集。数据存储库对于
TDP
数据遵守
FAIR
数据存储标准是必不可少的。将
TDP
数据集平台化并作为中央存储库的新途径和举措将对促进
TDP
数据的可访问性和共享非常有价值,这反过来将使
TDP
领域受益
。
面临的挑战与优化策略
TDP
的新技术在不断地发展,但是仍旧面临着诸多的挑战:(
1
)灵敏度。传统的
TDP
工作流程需要大量的样品(微克级的总蛋白或者数百万的细胞),以获得高质量的数据。新的高灵敏度的方法正在开发,例如
CE-MS
可实现对于单个细胞的检测,
Nanopots
技术可用于
TDP
,还有可以提高蛋白提取率的表面活性剂与尿素联用。(
2
)高分子量的蛋白质分子形式。高分子量的蛋白质难分离、信号差、仪器负担大。这就需要超高分辨率的平台,如
FTICR
质谱仪。在质谱分析之前,基于
SEC
或凝胶技术的基于尺寸的分离方法,例如,整合蛋白质组学方法或
PEPPI-MS
,可以解决大离子分析的挑战。但是没有单一的分离策略或者
MS/MS
仪器可以分析整个蛋白质组,需要开发新方法、新仪器以及改进的信息学工具来克服。(
3
)蛋白质的串联质谱。蛋白质在序列末端的片段化效率较高,而在中间的片段化覆盖率有限。这种差异在较大的蛋白质中更为明显,并且被认为是由于在变性条件下仍然存在的。内部碎片离子是由至少两个骨干断裂产生的,没有
N
或
C
端,在
TDP
碎片离子中越来越多地被考虑。最近开发的
TDP
软件
ClipsMS
可以将内部片段质量分配给蛋白质序列,从而提高整体覆盖深度。(
4
)定位修饰位点。由于不稳定的
PTMs
,低丰度的蛋白形式,
PTMs
的实验定位和蛋白质分子形式化学成分的精确表征具有挑战性。富集策略可以增强低化学计量或低丰度信号;还需要优化特定的碎片方法,例如,通过使用更温和的基于电子的方法,如
ETD
或
ECD
。(
5
)通量问题。
TDP
相对较低的吞吐量和较高的数据复杂性是新老用户的主要障碍。基于发现的
TDP
数据处理包括去卷积和数据库搜索,这可能需要几个小时到几天,具体取决于软件性能和搜索参数。自动制备和分离系统的发展,以及软件性能的提升都有助于改善通量的问题。
展望
TDP
是目前唯一能够确定蛋白质形
分子形式
特征并量化其丰度的技术。由于蛋白质
分子形式
的基本重要性及其作为细胞、环境或生物系统健康标志的潜在作用,
TDP
技术有望继续快速发展。
需要解决的两个关键领域是改进复杂
蛋白质分子形式
混合物的深度表征和
大分子量蛋白
的识别和表征。一个令人兴奋的发展是单离子测量,它可以在现有的商业仪器和专门的
前体类型
上实现。液相色谱固定相
、
CE
-MS
、
基于
IMS
的分离的发展以及与多维方法的整合将继续改善蛋白质组学的测量。
利用基因组、转录组以及
BUP
的信息,可以构建更精准的数据库,用于分析一些更复杂的
PTMs
,例如蛋白的糖基化,这也是
TDP
的一个优化方向。为了将蛋白质分子形式与相关的可测量输出
(
例如转录物和代谢物
)
联系起来,并破译生物学的基本原理,可以将多组学的测量结合起来。此外,通过结合微流体、质谱成像和单离子测量等先进技术,有望将单细胞和空间生物学扩展到蛋白质分子形式分析。
[1] Roberts, D.S., Loo, J.A., Tsybin, Y.O., et al. Top-down proteomics[J]. Nature Reviews Methods Primers
,
2024
,
4(1)
:
38.
http://mp.weixin.qq.com/s?__biz=Mzg2MjAxNDk5OA==&mid=2247486642&idx=1&sn=c4877dd492494a56d4fa345cb2c6f2d2
李惠琳课题组
推介Top-down MS原理、新技术、新方法以及相关结构质谱方法及其在翻译后修饰调控机制、蛋白-药物相互作用、 蛋白质机器结构及功能解析等领域的前沿文献与工作交流。
最新文章
J. Am. Soc. Mass Spec.|使用DPS评估HDX-MS中的蛋白酶切效率
Anal Bioanal Chem.| 基于质子转移电荷还原技术实现抗体自中而下分析的通用方法
Proteomics. |SDS-PAGE与CZE-MS相结合,用于组蛋白proteoform的Top-down分析
Anal. Chem.|Taylor – Aris扩散辅助质谱法分析天然蛋白质
Nat. Struct. Mol. Biol.|核糖体上蛋白质折叠的共翻译路径
J. Am. Soc. Mass. Spec.|非变性和变性的自上而下质谱用于单克隆抗体的鉴定
Nature Communications|基于深度学习的糖肽碎片质谱预测
J. Am. Soc. Mass Spec.|使用Native MS和HDX-MS探究高阶蛋白复合物结构
香港理工大学蛋白质组学课题组诚招两名2025年博士研究生
Anal. Chem.|一次性单细胞蛋白质组和代谢组同步分析策略
Nat. Commun.|使用非数据依赖采集法实现氢/氘交换质谱数据自动化分析
J. Am. Soc. Mass. Spec.|一种在线的Native MS方法用于腺相关病毒衣壳含量比率的快速、灵敏和定量评估
第三届JPrOS自上而下蛋白质组学线上研讨会
Nature Reviews Methods Primers|Top-Down 蛋白质组学
Anal. Chem.|循环离子淌度用于氢氘交换质谱
Anal. Chem.|Panda-UV解锁紫外光解(UVPD)质谱产生的内部碎片
Anal. Chem. |通过平行代谢物提取和高分辨率质谱对人体心脏组织进行全面的代谢组学分析
J. Am. Chem. Soc.|利用HDX-MS分析糖原磷酸化酶的瞬时态的结构动力学
Anal. Chem.|循环离子迁移-质谱和串联碰撞诱导去折叠技术用于定量难以捉摸的蛋白质生物标志物
J. Am. Soc. Mass Spectrom|基于电子转移解离的蛋白质组学中分子内氢重排的实际影响
J. Proteome Res. 丨PepPre:利用准确和全面的前体离子信息提升多肽鉴定
Mol. Cell. Proteomics丨利用AlphaFold2与交联质谱建模柔性蛋白质结构
Anal. Chem.丨小型连续尺寸排除色谱(s3SEC)用于高灵敏度自上而下蛋白质组学检测高质量Proteoforms
J. Am. Soc. Mass Spec.|PNGase Rc色谱柱用于氢氘交换质谱中复杂糖蛋白的在线去糖基化
转载|大话 TopDown:“Proteoform”一词的前世今生
Nat. Commun. | 非变性纳米蛋白质组学捕获内源性心肌肌钙蛋白复合物的结构和动态性信息
J. Am. Chem. Soc.|μMap光催化临近标记支持小分子结合位点映射
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉