科研人必须知道的人类蛋白质图谱数据库:HPA

学术   2024-11-25 07:07   北京  

哈喽,大家好啊!今天小编给大家推荐一个巨好用的蛋白组学数据库:https://www.proteinatlas.org/。点开即可登录使用,无需注册!        

 

The Human Protein Atlas(简称HPA)数据库(https://www.proteinatlas.org/)[1],2003年由瑞典 Knut & Alice Wallenberg基金会创建,旨在通过整合多种组学技术,包括基于抗体的成像、基于质谱的蛋白质组学、转录组学和系统生物学,绘制人类细胞、组织和器官中的所有蛋白质。资源中的所有数据都开放访问。人类蛋白质图谱由十二个独立的部分组成,每个部分侧重于人类蛋白质全基因组分析的特定方面。

图1 The Human Protein Atlas数据库

一、数据库使用  

整个界面简洁明了,Search栏中我们可以搜索想要查的基因或蛋白信息。在Field可以进一步限定检索范围,包括GENE INFO,ANTIBODY VALIDATION, PROTEIN ENVIDENCE,EXTRA等。   

图2 The Human Protein Atlas搜索界面

下面我们以免疫治疗领域的热门靶点之一:CD93为例来了解一下HPA数据库吧。

1.获取基因基本信息。   

输入CD93点击search,即可得到该基因的相关信息,包括基因的描述(Gene description),证据评分(Evidence),以及该基因在各个图谱中的结果。图3位置1可下载该基因不同格式的转录组信息,图3位置2表示免疫组织化学(IHC)数据的可靠性:整圆表示IHC可靠性高,3/4圆表示IHC较为可靠,半圆及1/4表示IHC可靠性依次递减,建议同时参考其他数据库。接下来,我们分别来查看与讲解每个板块中所包含的信息。图3 搜索结果

点击基因描述,能看到基因/蛋白的“Summary”栏信息,包括基因/蛋白的基础信息,蛋白表达和定位信息、组织RNA表达信息、免疫细胞的特异性和表达簇、癌症的预后及特异性、细胞系的特异性和表达簇、血液中的蛋白质信息及蛋白质功能信息。    

图4 基因描述结果

2.组织图谱  

图5位置1中,“PRIMARY DATA”显示不同抗体在不同器官中的适用性数据资料。“TISSUES”显示CD9蛋白在某个组织(如LUNG)的更具体的信息。“ANTIBODIES AND VALIDATION”表示抗体来源及验证过程。图5位置2中包含一般信息,蛋白图谱信息与免疫组化数据的可靠性。图5位置3中我们点击每个模板,可以分别看到蛋白表达情况在不同的组织当中RNA和蛋白的表达情况,多重蛋白质分析,表达聚类和相关性, CD93在4个数据下的转录水平表达。    图5 组织图谱

此外,在RNA和蛋白的表达情况中,我们如果想要了解某一个组织中详细的免疫组化的染色情况,通过点击具体的部位,即可看到其组织免疫组化的具体图片。

图6 组织图谱中RNA和蛋白的表达情况

3.脑图谱  

在脑图谱页面里可以看到整合了人、鼠、猪三种哺乳动物的基因表达情况中CD93蛋白的常规信息,蛋白图谱信息。    

图7 脑图谱基本情况

   并且可视化了人、鼠、猪在不同脑区的表达情况。

图8 人、猪、鼠在不同脑区的表达情况

4.单细胞类型图谱   

scRNAseq分析基于公开的全基因组表达数据,包括557个细胞类型簇中的所有蛋白质编码基因,对应于15个不同的细胞类型组。进行特异性分类以确定这些单细胞类型中升高的基因数量。    

图9 单细胞类型图谱

5.组织细胞类型图谱   

组织细胞类型图谱里包含所有人类蛋白质编码基因的细胞类型表达特异性预测,这些预测使用对公开可用的批量 RNAseq 数据的集成网络分析生成。特异性分类用于预测哪些基因富集在单个组织内的每种组成细胞类型中。

图10 组织细胞类型图谱

6.病理图谱   


在病理图谱页面可以看到TCGA数据中,CD93在人类癌症的 mRNA 和蛋白质表达数据的病理学信息,以及免疫组织化学染色组织切片图像和 Kaplan-Meier 图,显示了每个人类蛋白质基因的 mRNA 表达与癌症患者生存之间的相关性。    

图11 病理图谱基本信息

在这里可以选择不同的肿瘤,每个肿瘤类型提供多个病人的年龄、性别、人种、癌症阶段、预后时间,以及生存散点图、生存分析、对应的肿瘤组织IHC染色结果图等信息。同时还会有不同的组织器官/肿瘤组织的IHC的染色结果图,这些结果可以作为文章的作证来进行引用。

 

图12 病理图谱中CD93在癌症病人的预后信息、RNA与蛋白质表达

7.疾病血液图谱  

疾病血液图谱包含了泛癌症队列中,不同疾病患者血液中蛋白质水平的信息

图13 疾病血液图谱

8.免疫细胞图谱   

三种数据库中CD93在18种不同类型的免疫细胞的表达。

   

图14 三种数据库中CD93在18种不同类型的免疫细胞的表达

9.血液蛋白图谱   

绘制血细胞的蛋白质组学图谱将会是血液学下一个阶段的研究重点。HPA数据库中有基于质谱的蛋白质组学研究、已发表的免疫测定数据和基于邻近扩展测定 (PEA) 的纵向研究,在人体血液中检测到的蛋白质的估计血浆浓度。

   

图15 血液蛋白图谱

10.亚细胞图谱   

亚细胞图谱中,我们可以能看到CD93蛋白在细胞中的表达位置,并通过蛋白的表达位置来确定这个蛋白可能具有的功能。

   

图16 亚细胞图谱

我们还可以知道基因表达的空间位置以及表达强度,使用HPA数据库的免疫荧光检测结果可以作为生信分析时湿实验验证的数据补充。

图17 CD93蛋白质在不同细胞系中的亚细胞定位

11.细胞系图谱   

细胞系图谱中能看到CD93蛋白在不同的组织中不同细胞系的RNA表达量。   

图18 细胞系图谱中CD93在不同的组织中不同细胞系的RNA表达量

12.结构图谱  

结构图谱主要展示了CD93蛋白的结构和其他关键信息,如氨基酸序列等图19细胞系图谱中CD93在不同的组织中不同细胞系的RNA表达量

二、HPA在文章中的应用   


这么多功能,到底怎么用呢?下面我们来看看已经发表文章怎么用HPA数据库发文的!

1.患者生存分析

生存分析是诊断患者预后的重要指标。例如乌尔姆大学生理化学研究所研究人员[2]对于人类胰腺癌患者的生存分析,使用人类蛋白质图谱(Human Protein Atlas,HPA)数据库将患者IKBKG(NEMO)的表达分为两组(高表达和低表达),并比较了这两组患者的生存率。总生存率分析可是肿瘤研究中必不可少的参考因素啊!

2.探究癌症患者与正常样本的蛋白表达

Yongkang Ye等[3]采用人类蛋白质图谱(HPA)数据库探究前列腺癌和正常样本中LDHA和LDHB的蛋白差异表达,确认了LDHA和LDHB在 前列腺癌中差异表达。

3.辅助材料

在“Combining RNAscope, Immunohistochemistry (IHC) and Digital Image Analysis to Assess Podoplanin (PDPN) Protein and PDPN_mRNA Expression on Formalin-Fixed Paraffin-Embedded Normal Human Placenta Tissues”[4]一文中,作者在引言中表示根据《人类蛋白质图谱》,PDPN蛋白表达(通过IHC检测)仅限于胎盘绒毛的基质细胞,但在滋养层细胞中缺乏。

更多的用处靠大家可以进一步去探索这个数据库啊!

参考文献

[1]Proteinatlas.org. The Human Protein Atlas [Available from: http://www.proteinatlas.org.]

[2]Tsesmelis, M., Büttner, U.F.G., Gerstenlauer, M. et al. NEMO/NF-κB signaling functions as a double-edged sword in PanIN formation versus progression to pancreatic cancer. Mol Cancer 23, 103 (2024). https://doi.org/10.1186/s12943-024-01989-x

[3]Ye, Y., Yang, F., Gu, Z. et al. Fibroblast growth factor pathway promotes glycolysis by activating LDHA and suppressing LDHB in a STAT1-dependent manner in prostate cancer. J Transl Med 22, 474 (2024). https://doi.org/10.1186/s12967-024-05193-9

[4]Tomescu, L.C.; Cosma, A.A.; Fenesan, M.P.; Melnic, E.; Petrovici, V.; Sarb, S.; Chis, M.; Sas, I.; Ribatti, D.; Cimpean, A.M.; et al. Combining RNAscope, Immunohistochemistry (IHC) and Digital Image Analysis to Assess Podoplanin (PDPN) Protein and PDPN_mRNA Expression on Formalin-Fixed Paraffin-Embedded Normal Human Placenta Tissues. Curr. Issues Mol. Biol. 2024, 46, 5161-5177. https://doi.org/10.3390/cimb46060310    



最新文章汇总(持续更新ing)


最新热点方向

1、今天开心,安利一个超好发版干湿结合思路

2、掌握孟德尔随机化发20分不是梦

3、研究中草药难发SCI?

4、公开数据纯分析发7+,内容不卷赢在选题

5、人手一篇的“淋巴转移”,摇身一变50+


生信人课堂

1、临床医生科研规划

2、热点基因集预后实操课程

3、孟德尔随机与基因组

4、R语言入门


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多





END


生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章