这也太city了吧!北京大学詹思延教授团队整合蛋白质组+转录组+孟德尔随机化,纯生信拿下1区10分+!这个框架大有搞头!

文摘   2024-07-08 19:02   山东  
船长拉着满船的生信干货“入港”啦~相信很多小伙伴虽然已经接受了纯生信难发的现状,不过心里总还是想着纯生信真不行?
纯生信不是不行,还得看框架,传统的三板斧肯定是不行(ps:想在生信方面做点新东西欢迎来找船长哦~个性化方案设计、生信分析、润色投稿选刊一条龙服务~)。现在立刻马上船长就分享一篇高分纯生信文章,来自北大詹思延教授团队,提前看下它的要点吧:
1.多组学整合分析方法:整合了蛋白质组学和转录组学的数据,通过血浆蛋白质组范围关联研究(PWAS)和转录组范围关联研究(TWAS),使用双样本孟德尔随机化和基于摘要的MR(SMR)方法,这为识别CKD的潜在治疗靶点提供了一种新的多维度视角。
2.大规模数据集的应用:研究利用了来自冰岛、Fenland、UK Biobank等大型队列的大规模数据集,涵盖了从数千到数十万的样本量,这为研究提供了强大的统计能力,增强了发现的可靠性和普适性。
3.系统生物学角色探索:通过蛋白质-蛋白质相互作用(PPI)网络分析、基因本体(GO)富集分析、单细胞富集注释以及与先前证据的比较,研究不仅识别了与CKD相关的蛋白质和基因,还探索了它们在生物学途径中的潜在作用和机制,为未来的药物开发和干预策略提供了新的理解和方向。

定制生信分析

云服务器租赁

加好友备注“99”领取试用

后台回复321获取原文献,文献编号20240708

l题目:通过整合多组学蛋白质组和转录组来鉴定慢性肾脏疾病和肾脏功能的新治疗靶点
l杂志:Genome Medicine
l影响因子:IF=10.4
l发表时间:2024年6月

研究背景

慢性肾病(Chronic Kidney Disease, CKD)是一种以结构和功能损伤为特征的进行性疾病,影响着全球大约10%的人口。CKD患者面临许多不良结果的高风险,包括需要肾脏替代治疗、心血管事件和死亡。然而,这种严重且普遍的疾病在临床实践中没有有效的治疗方法,需要新策略来延长肾脏和患者的生存期,避免透析和肾脏移植[3]。更深入地识别和理解CKD生物学途径中涉及的生物标志物对于确定潜在的治疗靶点至关重要。
研究思路
1.选择CKD潜在蛋白质靶标:通过三个大型全基因组关联研究(GWAS)数据集,利用蛋白质组范围关联研究(PWAS)和两样本孟德尔随机化(MR)方法选择慢性肾病(CKD)的潜在蛋白质靶标。
2.验证基因表达与关联性:使用基于摘要的孟德尔随机化(SMR)方法,通过转录组范围关联研究(TWAS)来验证这些候选血浆蛋白编码基因的表达,并识别一致的关联性。
3.探索蛋白质靶标的作用:通过对跨祖先的CKD、肾功能表型以及不同CKD临床类型进行敏感性和复制性分析,探索这些候选蛋白质靶标的作用。
4.共定位分析:通过共定位分析来验证已鉴定蛋白质与CKD共有的编码基因位点。
5.生物学机制探索:通过蛋白质-蛋白质相互作用(PPI)和基因本体(GO)富集分析来探索潜在蛋白质靶标的可能生物学机制。
6.证据分类:根据MR、SMR、共定位分析的结果,以及与先前证据的比较,对本研究的证据进行分类。

       

图1 研究设计
数据来源
曝露因素:血浆蛋白质组        
冰岛:35,559名冰岛人的4,907个配体
Fenland:10,708名参与者的3892种蛋白质
UKB-PPP:54,219名参与者的2,923种蛋白质
曝露因素:转录组(mRNA)
eQTLGen:31,684份血液样本
CAGE:2,765份血液样本
Westra等人:3,511份血液样本
PsychENCODE:1,387份大脑样本
GTEx (v8):来自49种组织的15,201个样本
CKD结局
CKD1:480,698名欧洲人(CKDGen)
CKD2:625,219名跨祖先参与者(CKDGen)
CKD3:117,165名欧洲人(CKDGen)
CKD4:482,858名欧洲人(UKB+FinnGen)

主要结果

1.CKD上的假定血浆蛋白质
通过整合三个大型GWAS数据集并应用FDR校正,研究发现了32个与CKD显著相关的蛋白质。IDI2和MFAP4在所有数据集中均有显著性。F-统计量和MR-Egger检验结果表明研究结果稳健,没有明显的偏差或多效性问题。

图2 A展示了三个数据源中与主要CKD结果相关的个别蛋白质的火山图。红线代表FDR校正的阈值(q<0.05),红点表示显著的蛋白质
2.CKD上假定蛋白质的关联性
发现32种蛋白质与CKD的关联性,其中多数蛋白质与CKD风险负相关。通过不同的敏感性分析验证了这些关联的稳健性,即使在排除某些数据后,大多数关联仍然保持一致。

图2B 通过了FDR校正的A中鉴定蛋白质的森林图,用于CKD风险。任何1个数据集中显著蛋白质的ORs(比值比)和95% CIs(置信区间)被报告。对于在超过1个数据集中可用的蛋白质,ORs和95% CIs通过固定效应元分析合并,并显示为联合效应。空心点代表P>0.05,实心点代表P<0.05
3.CKD上蛋白质编码基因表达的关联性
将32种蛋白质关联的基因表达与CKD风险联系起来,发现14个基因表达与CKD风险呈负相关,而其他基因表达则与之正相关。某些基因在不同组织中的表达效应不同,提示可能存在非目标效应,这对药物开发具有重要意义。

图3与CKD相关的已鉴定蛋白质编码基因的热图。热图显示了血浆和组织特异性蛋白质编码基因表达对已鉴定蛋白质CKD风险的影响。颜色代表了SMR分析的β估计值,其中绿色表示CKD风险降低,红色表示每SD增加的基因表达使CKD风险增加。
4.蛋白质与其他 CKD、肾功能和 CKD 亚型的关联
总结了32种假定蛋白质与CKD不同表型之间的关联性,其中多数蛋白质与eGFR指标有显著关联。部分蛋白质与CKD快速进展和特定CKD亚型的关联性在不同数据集中得到了验证。此外,某些蛋白质在不同组织中的效应不同,可能提示药物开发的非目标效应。

图4 与广泛的CKD相关表型相关的已鉴定蛋白质的气泡图

图5 32种已识别蛋白质与不同 CKD 数据来源、肾功能表型、肾功能快速衰退表型和 CKD 临床类型的关联
5.假定蛋白质与CKD的共定位
部分假定蛋白质与CKD的共定位程度较高,表明它们可能与CKD有共同的遗传基础。其中,一些蛋白质与CKD强烈共定位,而其他一些则显示出中等程度的共定位。

图S8 共定位分析的区域图
6.假定蛋白质的蛋白质-蛋白质相互作用网络、基因本体富集和单细胞富集
构建了假定蛋白质的PPI网络,并通过基因本体和单细胞富集分析探讨了这些蛋白质的生物学功能和细胞特异性。发现多个蛋白质在免疫相关途径中富集,且在肾脏单细胞和组织细胞中表现出特异性表达。

图6 蛋白质-蛋白质相互作用网络
7. 结果总结
根据MR、SMR(基于摘要的MR)和共定位分析,与CKD(慢性肾病)有因果关联并在至少2个CKD相关表型中重复出现的32种蛋白质被分为3个等级。
第一等级包括通过了MR、SMR和共定位分析的8种蛋白质。与以往的研究相比,32个位点(已映射的基因)中有11个被先前的GWAS(全基因组关联研究)识别,32个基因中有8个被先前的MR研究识别,32种蛋白质中有6种被先前的MR研究识别。本研究中每种蛋白质与基因表达和CKD或相关表型之间的关系方向与先前的MR证据一致。
在观察性研究中,之前报告了10种蛋白质,其中sRAGE、LEAP2、AIF1和PFKFB2与观察性证据一致,而C4a、C4b和UMOD仅与先前的MR一致。总结来说,20种蛋白质/编码基因既没有通过以前的转录组范围或蛋白质组范围的MR报告,也是新的因果发现。

文章小结

想靠整合数据发高分,这篇文章就是好的参考!不过看这么多数据有些望而却步了?算力不够了?分析太多眼花缭乱了?你抬头看看,船长就站在这里等着你~如果您一直在不懈学习,我们有物美价廉的服务器租赁(预装专业分析软件,专门老师指导~);如果您做不动了,我们还有个性化分析定制,船长乖巧等call~        

船长寄语


船长可以为您提供以下服务哦:评估思路(免费)、生信分析、方案设计、服务器租赁、特色数据库搭建等!欢迎大家扫码咨询,有问必答!

生信分析

思路设计

服务器租赁

扫码咨询船长

往期推荐



1、【NC】经费足直接冲:复旦大学郁金泰等团队:全外显子组关联分析(UKB可申请数据)+孟德尔随机化一举拿下14.7分!
2、可复现性极强的nature子刊思路!泛凋亡+机器学习果然是生信统治区~
3、先天科研圣体!西南医科大学这篇数据挖掘+机器学习+单细胞,超经典数据挖掘套路SCI拿到手软!
4、一个月接收!南方医大南方医院用空转+单细胞+机器学习教你实力上分,三大法宝直击editor小心肝
         

 

   

生信海
怕错过生信热点?来生信海,船长日更不落伍!船长擅长思路设计、个性化生信分析、高分文献复现、特色数据库搭建等,欢迎来撩~
 最新文章