如何了解某蛋白的亚细胞结构、表达位置、翻译后修饰位点、可变剪切体、疾病/表型等重要信息?

文摘   2024-12-19 17:06   江苏  

无论是基础研究、临床研究,还是新药研发,蛋白分析永远是绕不开的一环。怎么详细、全面了解你要研究的目的蛋白信息?


如:目的蛋白对应的基因名是什么、有哪些生物学功能,GO注释信息有哪些,还有它的亚细胞结构、蛋白表达位置、可变剪切体、可修饰类型、和什么疾病/表型关联,结构域及对应序列、和什么蛋白相互作用等等......


UniProt 了解一下,一个数据库帮你搞定所有问题!



uniprot


官网:https://www.uniprot.org/

Uniprot的数据主要来自于基因组测序项目完成后获得的蛋白质序列,并包含了大量来自文献的蛋白质的生物功能信息。如了解目的蛋白的名称(从常用到用过的)、功能、亚细胞结构、疾病/表型和变异体、蛋白表达位置、可修饰类型、互作信息等。



以“PD-L1”为例,检索框输入“PD-L1”,点击Search,左侧边栏选择物种,检索结果中找到目的蛋白。



1

Function--蛋白功能


Function部分会罗列出蛋白的基本功能,且每一条蛋白功能信息都标注了对应的参考文献,方便我们做更深层次的追溯。


这里说明了PD-L1的主要功能有:在诱导和维持对自身免疫耐受中发挥着关键作用;作为抑制受体 PDCD1/PD-1 的配体,调节 T 细胞的激活阈值并限制 T 细胞效应反应;通过一个尚未知的激活受体,可能刺激主要产生白细胞介素-10(IL10)的 T 细胞亚群;也可以作为转录共激活器发挥作用:在缺氧响应下,通过与磷酸化 STAT3 的相互作用进入细胞核,促进 GSDMC 的转录,导致细胞焦亡等等。




2

GO annotations--GO注释


GO注释是对基因产物的功能进行描述GO 总共有三个 ontology,包括分子功能(Molecular Function,MF)、细胞组分(Cellular Component,CC)和生物学过程(Biological Process,BP),各自描述了基因产物的分子功能、所处的细胞位置以及参与的生物学过程。


UniProt 在“功能”部分列出注释的 GO 术语;“细胞成分”类别的 GO 术语也可以在“亚细胞位置”部分看到。标注项目的来源显示为“来源”,点击此标签将显示支持的证据类型。当可用时,会提供与相关出版物相关的链接。





3

Names &Taxonomy--名称及类别


Names &Taxonomy部分提供了蛋白质所有名称的详细信息,从常用到过时的,包括蛋白质全称、简称、基因名称,以及来源于NCBI数据库的生物名称、物种、分类谱系等信息,以便对蛋白质进行无歧义的识别。


如PD-L1的全称是Programmed cell death 1 ligand 1,简称是PD-L1,抗原名称是CD274,NCBI 为蛋白质来源生物分配的独特标识符为9606。


这部分还包含关于蛋白质活动的信息,例如酶的催化机制的精确描述,或者如果相关,关于其内包含的单个蛋白质链或功能域的信息。



这部分名称和分类部分适用于属于蛋白质组的条目,也就是那些被已完成基因组测序的生物体表达的蛋白质集。




4

Subcellular Location--亚细胞结构


成熟蛋白质必须在特定的亚细胞器里面才能发挥稳定的生物学功能。细胞内部可以进一步划分为不同的细胞区域或细胞器,即亚细胞。常见的亚细胞有细胞核、细胞膜、内质网、高尔基体、细胞质、线粒体、叶绿体等。


在Subcellular Location,包含成熟蛋白在细胞中的定位和拓扑结构信息。PD-L1它的亚细胞定位是细胞膜(Plasma membrane)和内体(Endosome)。



细胞亚部位”部分描述了膜跨蛋白的非膜区域所在的细胞亚部位。"细胞亚结构位置"部分描述了蛋白质膜跨区域的范围。它指出了alpha-helical跨膜区域的存在,以及beta-barrel跨膜蛋白的膜跨区域。这里详细列出 PD-L1 的胞外区、跨膜区和胞内区位置,以及它们相对应的氨基酸序列。




5

Disease & Variants--疾病/表型和变异体


Disease & Variants提供了关于蛋白质关联的疾病、表型和变异的信息。数据来源于OMIM 数据库。


Involvement in disease参与疾病部分这里说明了:“3'-UTR的 CD274 转录本的截断导致多种癌症中 CD274 的表达升高,包括 T 细胞白血病、弥漫大 B 细胞淋巴瘤和胃腺癌(PubMed:27281199)。3'-UTR 区域的破坏是由结构变异引起的,这些变异稳定了 CD274 转录本,导致过表达(PubMed:27281199)。肿瘤中表达的增加通过允许恶性细胞逃避免疫系统的破坏来促进免疫逃避和肿瘤细胞生长(PubMed:27281199)。”



Features疾病/表型和变异”部分描述了对蛋白质的生物特性影响,由一个或多个氨基酸的实验突变所造成的效果。



这部分供独立标签的"Disease & Variants"查看器,点击“Go to variant viewer”可以查看全局视图。提供了来自 UniProt 以及其他来源的数据,包括 ClinVar 和 dbSNP 的 1,178 个变体。





6

PTM/Processing--翻译后修饰情况


PTM/Processing描述了目的蛋白的翻译后修饰情况。会列举蛋白合成过程中的分子加工、氨基酸修饰及翻译后修饰,比如剪切、糖基化、脂酰化、二硫键位置等等。


WB实验中,经常会出现WB条带大小跟预测的不一样,那可能是目的蛋白是存在翻译后修饰,例如磷酸化、糖基化、泛素化等,这些均可能影响条带的位置。例如磷酸化导致蛋白质的迁移减慢,虽然磷酸根增加了蛋白质的负电荷,但多半由于构象变化和电荷排斥导致SDS结合减少,迁移减慢。另一种典型的修饰是糖基化修饰,这个影响很大,除了糖基化蛋白质结合SDS的能力下降外,糖基改变了蛋白质斯托克斯半径,迁移速率往往有较大的减慢。


在这里描述了STUB1 很可能介导 PD-L1/CD274 的多泛素化触发其降解;被 MARCHF8 泛素化导致降解;去泛素化由 USP22 完成导致稳定化。





7

Expression--蛋白表达


我们在进行 IHC、IF 实验时会遇到一个问题:我看到的阳性信号是不是特异的?这时候UniProt 就可以帮我们做一定的判断。


在Expression部分,阐述了多细胞生物中基因(mRNA 水平/蛋白水平)在细胞/组织中的表达情况。这里描述了PD-L1在心脏、骨骼肌、胎盘和肺部高度表达。在胸腺、脾脏、肾脏和肝脏中弱表达。在激活的 T 细胞、B 细胞、树突状细胞、角质细胞和单核细胞上表达。


这里还提供了诱导物和抑制剂在蛋白质(或 mRNA)表达水平上的实验验证效果(上调,下调,恒定表达)。PD-L1在 LPS 和 IFNG 激活后,上调于 T 细胞、B 细胞、树突状细胞、角质细胞和单核细胞上。在通过表面 Ig 交叉连接激活的 B 细胞中上调。




8

Interaction--互作信息


Interaction这里提供了关于蛋白质的四级结构的信息,以及与其他蛋白质或蛋白质复合体的相互作用。


如以下描述了PD-L1与 PDCD1 相互作用;通过跨膜域与 CMTM4 和 CMTM6 相互作用;与磷酸化 STAT3 相互作用,促进核定位;与 CD80 相互作用。这些互作信息都有文献标注,如果感兴趣可以做深入的挖掘。




9

Structure--结构


Structure提供了关于蛋白质的三级和二级结构的信息




10

Family & Domains--家族分型与结构


Family & Domains提供了目的蛋白与其他蛋白质的序列相似性信息以及蛋白质中所包含的结构信息。



"序列相似性"子部分提供了关于蛋白质所属蛋白质家族的信息。




11

Sequence & Isoforms--序列 & 可变剪切体


Sequence & Isoforms显示了目的蛋白标准蛋白质序列,如果该蛋白有不同的剪接体,也会展示所有可变剪切体,包含与序列相关的信息,包括长度和分子量。以下展示了目的蛋白PD-L1由选择性剪接产生的 4 种同工型:Q9NZQ7-1、Q9NZQ7-2、Q9NZQ7-3、Q9NZQ7-4,同时标注了各个转录本表达蛋白的基础分子量。


为什么要看目的蛋白含有多个异构体或剪切体?不同的转录本之间翻译出来的蛋白质大小可能不一样。蛋白发生了翻译后剪切,许多蛋白首先是以前体形式合成,之后通过剪切形成活性形式,大小也随之改变。


以序列最长的转录本为例,Mass (Da) 信息表明,该蛋白的基础分子量约为 33KD,但有人在实验中发现,实际胎盘组织中,PD-L1 的 WB 阳性条带却出现在 60KD 左右的位置。产生 20+ KD 大小的差值,这就是糖基化修饰造成的结果。


这也是为什么有些抗体的实际检测分子量和预测分子量有差别的原因之一,蛋白的翻译后修饰对于 WB 结果的判定,具有重要的辅助作用。做 WB 找不到目的条带可以往这个方向考虑。




12

Similar Proteins--相似蛋白


本部分提供了链接,指向不同序列相似度阈值(100%、90% 和 50%)下与目的蛋白描述的蛋白质序列相似的蛋白质,这些链接基于 UniProt 参考聚类(UniRef)中的成员关系。



我们通过 UniProt 上的信息了解到蛋白的基本功能、命名与来源、亚细胞定位、结构域及对应序列、可变剪切体、翻译后修饰位点等重要信息,有效利用这些信息,可以辅助课题/实验更加顺利的开展!


大家如果在WB、免疫组化、流式这些实验中遇到任何问题,都可以加一下我们的实验互助群,群内有很多同学/技术老师可以一起互助解决问题!


往期内容推荐


科研根号三
科研虐我千百遍,我待科研如初恋!这里有你关心的科研干货、资讯、软件、工具等。期待为同样热爱科研的你提供方便!
 最新文章