既往,观察性研究和随机对照试验(RCT)被用来进行因果推断,而观察流行病学研究无法避免混杂因素、反向因果关系和选择偏差的影响,RCT虽是在健康科学中建立因果关系的黄金标准,但存在伦理考虑、持续时间长、高成本等局限性。在这种情况下,孟德尔随机化(MR)方法便突显出优势!
通过Pubmed检索(mendelian randomization)发现,2024年MR相关的内容数量已超4千篇,为何如此火爆?从研究角度看,该方法利用遗传变异作为可改变的环境暴露的代理,对这些暴露的结果进行因果推断,类似于“自然”RCT,基于孟德尔的遗传定律和估计工具变量(IVs)的技术,MR可以推导因果关系,且可以避免混杂因素影响。从文章发表角度看,MR利用公共数据,具有周期短、成本低、发高分等优势。
基于以上数据,MR研究还没达到饱和状态,目前仍属于红利期,适用于各个科室的临床医生!那么,该如何结合临床实际设计思路,如何操作才能利用MR拿下高分SCI?感兴趣的朋友,欢迎来找生信湾定制分析~我们团队可以提供专业指导!有问题和疑惑的朋友,也可以通过小编加入专业交流群,与大家一起探讨交流~接下来,分享一篇来自Nucleic Acids Research(IF:16.6)的MR数据库相关文章,一起看看吧~
定制生信分析
云服务器租赁
(加微信备注66领取试用)
题目:DMRdb:一个以疾病为中心的孟德尔随机化数据库,用于系统评估疾病与基因、蛋白质、CpG位点、代谢物和其他疾病的因果关系
杂志:Nucleic Acids Research
影响因子:16.6
发表时间:2024年10月
研究背景
探索疾病与基因、蛋白质、CpG位点、代谢物和其他疾病之间的因果关系是生命科学的基础。然而,目前还缺乏使用孟德尔随机化(MR)分析的大规模研究。本研究介绍一个以疾病为中心的孟德尔随机化数据库——DMRdb,旨在系统地评估疾病与基因、蛋白质、CpG位点、代谢物和其他疾病的因果关系。
数据来源
从UK Biobank、MRC IEU、GWAS Catalog和FinnGen等在线平台收集和整理全基因组关联研究(GWAS)疾病特征的汇总级关联数据;基于血液与人类转录组相关的单核苷酸多态性(SNP)的表达数量性状位点(eQTL)队列的汇总数据来自eQTLGen联盟;与人类蛋白质组相关的SNP作为遗传工具的汇总数据来自三个大规模的GWASs;血液代谢物相关数据来自两项既往研究;CpG相关的甲基化数量性状位点(meQTL)的汇总数据来自DNA甲基化联盟(GoDMC)。
数据库内容和使用
1. 数据库内容
DMRdb包括来自6640个疾病GWASs的汇总数据,共有32个域的4047个独特特征。其中,6246项(94%)GWAS研究涉及的SNP计数超过100亿,5471项(82%)GWAS研究的样本量超过20万参与者。在上述GWAS数据集的基础上,通过MR分析系统地确定了五类疾病的潜在因果关系:疾病-疾病、基因-疾病、蛋白质-疾病、代谢物-疾病、CpG位点-疾病。该分析包括6640个疾病GWAS数据集,16238个eQTLs数据,2564个pQTLs数据,825个代谢物数据和12000个meQTLs数据;结果包括超过4.97亿对评估因果关系对,超过3800万对显示提示性关联;还进行了敏感性分析,包括Cochrane’s Q检验、MR-Egger’s截距检验、留一分析等;对1223篇疾病MR分析文献的结论进行认真整理,涵盖疾病与疾病间eQTL/pQTL关系的关联,其中疾病间因果关系MR研究文献1057篇,疾病间eQTL/pQTL关系MR研究文献166篇,因果关系>38万对(图1)。
图1 DMRdb的原理概述
2. 数据库使用
DMRdb提供用户友好的web界面,允许轻松访问有关疾病相关GWAS数据和MR分析结果的丰富信息。在首页,用户可以通过快速搜索功能输入关键字(如疾病名称、基因名称或蛋白质名称),通过IVW方法得到搜索结果;搜索页面提供高级搜索功能,进一步细化MR结果;Browse页面主要由侧边栏和数据表组成,可以在此页面上的交互式表格中查看MR分析结果列表,在侧边栏上,用户可以定制过滤器,根据疾病、基因和蛋白质等各种暴露来搜索MR分析结果;当用户点击Study ID时显示MR结果的详细信息;在疾病GWAS页面,用户可以浏览疾病特征GWAS数据集的基本信息,可以通过点击下载按钮下载GWAS数据;当用户单击研究ID时,显示疾病GWAS数据集的详细信息(图2)。
图2 DMRdb网页截图
3. DMRdb的应用示例
在观察性研究中,2型糖尿病(T2D)状态与发生冠心病(CHD)的风险较高相关,而这种性质的观察性流行病学研究容易出现各种偏差。在这项研究中,使用MR来获得基因预测的T2D状态对冠心病风险影响的无混淆估计。
具体步骤:
数据集选择:暴露:疾病GWAS ID:DGWAS-5576;结局:疾病GWAS ID: DGWAS-5735。
分析执行:在搜索页面上输入暴露ID和结局ID;选择所有可用的MR方法;点击“提交”按钮查询结果。
MR分析结果表明,遗传预测的T2D状态增加了发生冠心病的风险,其他MR方法证实了这一结论;通过点击Study ID可以访问MR分析的详细信息;此外,进行反向MR分析以检查遗传预测的CHD状态对发生T2D风险的影响,未观察到统计学上显著的关联(图3)。以上结果提示T2D对CHD的发生有负面影响,多种MR方法和其他验证步骤的一致结果加强了T2D状态与CHD风险增加之间因果关系的证据。
图3 双样本双向MR分析中T2D和CHD的潜在因果关系
文章小结
该研究开发的DMRdb,是生物医学研究人员寻求基于MR的疾病病因、遗传相互作用和治疗靶点的重要资源,支持meta分析、疾病之间的关联研究、遗传机制的阐明、识别危险因素、生物标志物和治疗靶点等广泛研究。利用DMRdb可以系统评估疾病与基因、蛋白质、CpG位点、代谢物和其他疾病的因果关系,那么,如何利用MR方法发文?具体如何操作?感兴趣的朋友来找生信湾设计思路、定制分析吧~
微信加群
为促进前沿研究的传播和交流,我们建立了专业交流群,长按下方二维码,即可添加小编微信进群,添加微信时请备注:学校/专业/姓名,如果是PI/教授,还请注明。
定制生信分析
云服务器租赁
扫码加群合集 · 推荐