还不知道rQTL是什么?快进来学习最新MR热点!

学术   2024-12-16 07:04   北京  

小编今天为大家分享一篇发表在Cell Genomics上的文章,本文利用UKBOlink蛋白组学数据,分析得到了rQTL (ratios between protein levels QTL),提供了该全新概念的GWAS数据,为理解蛋白调控网络如何影响疾病进展提供了新思路和资源。对有在做药靶MR的小伙伴来说,这个文章的资源可以用来做孟德尔随机化分析,为你的文章增色添彩噢~

添加微信

精彩推送不错过


一、什么是rQTL?为什么要鉴定rQTL?

蛋白质数量性状位点(Protein Quantitative Trait Loci,pQTL)是指与蛋白质表达水平相关的遗传变异位点。这些遗传变异可以影响特定基因的转录、翻译、或降解蛋白质等过程,从而影响人体中蛋白质水平。pQTL的发现有助于作者们理解个体之间蛋白质水平的差异,以及这些差异与健康、疾病等生物学过程之间的关系。这些位点的发现也可以为研究蛋白质与疾病之间的关联提供基础,有助于揭示潜在的治疗靶点和生物学机制。


这种基于遗传学的见解可以为药物靶点的发现和验证提供信息,生成关于作用模式的假设,并提出靶点参与和疗效的生物标志物。pQTL研究的早期成功促成了UK Biobank Pharma Proteomics Project(UKB PPP)联盟的创建,这是一个由13家生物制药公司组成的联盟,资助在Olink蛋白质组学平台上测量超过54,000个UKB样本。UKB PPP联盟最近发布了使用该平台进行的GWAS的初步结果,识别出超过10,000个pQTL。为了能够充分利用UKB PPP GWAS的数据,本文提出用rQTL(ratios between protein levels QTL)的方式来增加对pQTL的发现和解释。


本文假设,通过蛋白质水平比率(ratios between protein levels)的GWAS可以识别当前GWAS方法未能识别的蛋白质对之间的关联和新链接,从而发现更多有意义的pQTL。这个策略已经在代谢组学GWAS领域得到应用和证实。然而,进行全面的所有蛋白的比率GWAS的计算成本目前是不可承受的,在DNAnexus平台上进行一次全面的所有蛋白比率GWAS单次运行估计需耗费数十万英镑,还不包括处理生成数据的相关成本。因此,本文采用一种更经济的方法,测试部分相关的蛋白质之间比率的遗传关联。


本研究的整体思路(图1)为:对于UKB PPP联盟报告的涉及部分相关蛋白质之一的每个pQTL,测试这些两种蛋白质水平之间的比率与pQTL变异的关联。然后,在那些提高了已知pQTL位点关联强度的比率上进行GWAS研究。通过这种方法可以识别出UKB PPP联盟通过标准蛋白质水平GWAS未能发现的pQTL。在文中,作者还选取了一些具体蛋白进行了生物医学意义相关的讨论,并提供了作者认为使用比率(ratio)方法能更多识别pQTL的原因。

1:整体研究概览

二、主要研究步骤

1.在已建立的pQTL位点上的鉴定比率QTL (rQTL)

首先作者引入了“p-gain”的概念,通过p-gain来量化比率关联强度的增加。对于两个蛋白的pQTL来说,p-gain定义为单蛋白关联的p值中较小的一个除以比率关联的p值。p-gain为10相当于单次测试的p值;换句话说,当测试两个随机蛋白之间的比率时,5%的情况下预期会观察到p-gain为10的结果。在使用Bonferroni矫正显著性水平后,仍具有显著p-gain的蛋白比率关联称为rQTL。


作者使用UKB PPP的Olink数据(包含43,000人的发现集和一个包含8,700人的重复验证集),对179,923个比率-变异对进行了关联测试。共有10,760个比率关联(5.98%)具有Bonferroni显著的p-gain (>10×179,923),其中4,248个(41.4%)在验证集队列中得到验证(p-gain >10×10,760)。


2. 在GWAS中使用比率识别rQTL

使用UKB基因分型数据对2,821个比率进行了GWAS。对于每个比率,作者保留了达到Bonferroni显著性水平的最强关联。作者识别出8,462对比率-变异对,这相当于每个测试比率平均发现三个具有显著p-gain的独立GWAS信号(图2)。发现rQTL数量最多的比率是肝素结合EGF样生长因子(HBEGF)/血小板衍生生长因子亚基A(PDGFA)(N = 25)。共有999种蛋白质至少涉及一个rQTL,每种蛋白质的中位数为八个rQTL。最常出现的两种蛋白质是ITGB1BP2(259个rQTL),和ectodysplasin A receptor(237个rQTL)。相较于既往标准方法获得的pQTL,使用比率(rQTL)从UKB PPP Olink数据中获得的遗传信号增加了24.7%。

2GWAS信号位置

为了研究这些rQTL是否提供了新的具有生物医学意义的信息,作者使用PhenoScanner对本研究中识别的2,095个rQTL和UKB PPP GWAS报告的5,717个pQTL进行了注释,关联了446个不同的GWAS性状。这些rQTL为药物靶点选择提供了新的证据。例如,rs3764640与比率STK11/USP8相关(-log10(p) = 13.8, log10(p-gain) = 10.5)。该变异是STK11基因中的一个内含子SNP,与阿尔茨海默病(AD)病例中有无精神病的存在相关。STK11是一种丝氨酸/苏氨酸蛋白激酶,而USP8可能在通过泛素化降解活化的蛋白激酶中起作用,这解释了比率的显著p-gain。因此,这个rQTL不仅支持STK11在AD病理中的作用,还提供了对潜在生物学途径的进一步见解,暗示STK11或其磷酸化靶点的药物修饰可能影响AD相关表型。


3. 鉴定 cis-pQTLs

之前关于UKB PPP 的研究在 1463 个检测的蛋白质中鉴定了 1163 个 (79.5%)中具有 cis-pQTL 的蛋白质。在此,作者报告了 39 个额外的遗传变异体,这些变异体与一个位于 cis 的蛋白质和一个位于 trans 的第二个蛋白质的比值有关。这些 cis-pQTLs 之所以能被发现,可能是因为这些比值中的 trans 蛋白捕捉到了一些未识别的共享非遗传变异,这些变异导致了显著的 p 值增加。


4. rQTL 位点的精细化

出于经济原因的考虑,GWAS 使用了仅已知基因分型的变异进行,因此作者可能错过了一些感兴趣的变异。因此,对于每个 8,462 个 rQTLs,作者在发现和重复验证队列中使用了 UKB 的基因型数据,在±500,000 bp 范围内精细化了关联。所有 8,462 个精细化区域的汇总统计数据作者已在 FigShare 上提供(https://doi.org/10.6084/m9.figshare.23695398)。这些数据还可以用于进一步精细化感兴趣的位点,例如,使用 SuSiE识别潜在的多个独立信号,或使用 coloc测试与其他感兴趣特征的共定位。


三、讨论与思考

1. 为什么比值有效?它们代表什么?

此处作者给出了详细的公式来解释这个问题,感兴趣的小伙伴可以到原文查看~最终作者给出的结论是:有多种可能的原因可以导致比值关联中的显著 p-gain;一些 rQTLs 揭示了共享遗传变异的存在,而另一些则表明比值中的蛋白质通过一些共享的非遗传过程相关(图 3)。

3: cis-rQTLtrans-rQTL的生物学意义假说

2. 从rQTLs中能获取什么信息?

a)蛋白质互作信息。在本文鉴定的2,281对蛋白质中,有168对(6.0%)在STRING数据库中有高置信度评分(>0.7)的蛋白质-蛋白质相互作用链接。

b)细胞因子和受体。使用CytokineLink的细胞因子和细胞因子受体注释,确定了39对蛋白质对,涉及细胞因子-细胞因子对,15对受体-受体对和9对细胞因子-受体对,其中7对已知,2对为新发现。

c)当多个蛋白质与同一变异体在rQTLs中关联时,可以构建相关蛋白质的网络


四、总结与收获

通过对本文的学习,我们了解了rQTL的定义及鉴定其的原理和意义,打开了增加pQTL鉴定的新思路~同时对想进行孟德尔随机化的的小伙伴,文章也提供了完整数据噢,可以抓紧做起来啦!


原文链接:https://doi.org/10.1016/j.xgen.2024.100506


添加微信

精彩推送不错过


最新文章汇总(持续更新ing)


最新热点方向

1、去年才出的review,今年就有顶刊了——神经免疫

2、医之侠者:中国肺癌领军人物吴一龙

3、陈志坚成果汇总|大概率是华人下一位诺奖获得者

4、《Nature》中肠道菌群研究的正确打开方式

5、这文章才十来分,是被nature撤稿影响了吗?


生信人课堂

1、多组学水平的孟德尔随机化分析套路

2、单细胞+空转王炸组合,探索骨骼肌纤维化巨噬细胞

3、以小博大,紧张刺激:肿瘤耐药研究,从基因到网络

4、零基础入门-单细胞课程

5、史上最全格局打开,细讲基因组学,确定不来学学?


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多






END


生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章