Nat Commun绝对是生信人的心头好!7万+样本的深度学习联合影像组学+孟德尔随机化,纯生信发顶刊!

文摘   2024-11-10 19:00   上海  

不得不说,Nat Commun真是一本神奇的期刊,对纯生信也是非常友好,当然能发在这上面的纯生信文章肯定也绝非等闲之辈。

今天,馆长带来一篇瑞士科研团队近期发表的一篇文章Phenotypic and genetic characteristics of retinal vascular parameters and their association with diseases。该研究利用深度学习方法处理超过130,000张来自近72,000名UK Biobank参与者的眼底图像,提取了17种不同的视网膜血管形态表型,包括血管直径、直径变异性、主时间角度、血管密度等;通过GWAS估计了这些表型的遗传性;通过孟德尔随机化分析,提出了血压和体重指数对视网膜血管形态的因果影响;而且作者在两个独立的较小队列中验证了关键结果。0实验拿下NC,馆长羡慕的不要不要的~大数据时代,咱们就应该学会拿公开数据发文章!需要思路设计和生信分析的宝子抓紧滴滴馆长吧~ps:跑代码卡顿、电脑不给力的宝子也可以找馆长试用稳定高速服务器,让分析顺畅无比!

定制生信分析

云服务器租赁

加好友备注“99”领取试用


题目:视网膜血管参数的表型和遗传特征及其与疾病的关系

杂志:Nat Commun    

发表时间:2024.11

后台回复“666”获取原文献,编号241110

研究背景

眼底图像允许对视网膜血管的非侵入性评估,其特征提供了重要的健康信息。作者使用全自动图像处理管道,从近72,000名英国生物银行受试者的130,000多张眼底图像中提取了17种不同的形态血管表型,对这些表型进行全基因组关联研究。

研究思路

作者对17种视网膜血管表型进行了联合分析。利用来自UK Biobank的数据,在质控(QC)后为近72 k受试者提供视网膜血管表型。对于所有表型,进行了GWAS,遗传力估计,基因和途径分析,以及与广泛的系统和眼部疾病的关联。此外,在两个独立的较小队列中重现了表型相关结构。    

研究结果

视网膜血管IDPs的相关结构和遗传力

为了探索主要IDPs(图像衍生表型)之间的关系,作者计算了成对表型Pearson相关性r(p)。为了评估IDPs之间的遗传关系,使用交叉性状连锁不平衡得分回归(LDSR)估计了成对遗传相关性r(g) (图2a)。

为了更深入地了解视网膜血管形态的遗传控制,作者使用LDSR估计了每个IDP的单核苷酸多态性(SNP)遗传力h2(图2b)。分析显示了IDPs的遗传程度各不相同。    

视网膜血管IDPs的基因和通路水平分析

与IDPs相关的基因数量(图3a对角线)从1个与动脉中位直径相关的基因到252个与动脉扭曲相关的基因不等。观察到扭曲、静脉直径变异性和静脉中央视网膜等效性的基因数量最多。图3a中的非对角线元素显示了每对IDPs的共同基因数量。

虽然没有单一基因在所有IDPs中共享,但两个基因(LINC00461和CTC-498M16.4)与17个IDPs中的9个相关(图3b)。其他与多种IDPs相关的基因包括SIX6、FLT1、FUT1、HERC2和PDE6G。

为了进一步研究多效性基因,作者采用了PascalX交叉GWAS分析。这种方法比仅仅交叉两种个体表型的基因集更有力量,也允许区分相干和反相干效应。然而,即使在这种更敏感的分析中,也没有单个基因在所有对表型之间共享。大多数多效性基因在很大程度上与通过简单基因评分鉴定的基因重叠,但它们往往在更多的IDP中共享(图3c, d)。    

与疾病和危险因素的表型关联

为了评估视网膜血管形态的临床相关性,作者检查了视网膜血管IDPs与各种眼睛相关疾病、血管疾病及其相关危险因素之间的表型关联。作者对连续疾病变量(对应于危险因素)采用线性回归(图4a),对二元疾病状态采用逻辑回归(图4b),对发病年龄诊断采用Cox模型(图4c)。所有IDPs都被标准化(z评分),并根据潜在的混杂因素进行调整。    

与疾病的遗传关联及因果分析

为了研究血管IDPs和危险因素之间共同遗传结构的程度,首先使用LDSR来估计它们的遗传互相关性。观察到血压测量与中央视网膜等价物比率和血管密度之间存在最强的负相关(≈0.30)。体重指数(BMI)与中静脉直径(≈0.15)及其变异(≈0.18)呈正相关,与动脉血管密度和分支数呈负相关(图5a)。

为了比较血管IDP与危险因素之间的表型和遗传关联,作者绘制了表型线性回归对每个IDP/危险因素对遗传相关性的效应大小(图5b)。除LDL胆固醇外,通过相应点的最佳拟合线的斜率对所有危险因素均为正。    

两种表型之间的强烈遗传关联并不意味着存在因果关系。为了系统地评估血管IDPs和危险因素之间的潜在因果关系,作者进行了双向双样本孟德尔随机化(MR)分析。使用错误发现率(FDR)来纠正多重测试,还进行了敏感性分析,以确认我们结果的稳健性。

使用风险因素作为暴露,观察到对大多IDPs的因果影响的证据,即使进行多重校正(图5c)。

相比之下,使用IDPs作为暴露,只有比率中心当量对BP (SBP和DPB)的因果效应在FDR校正后幸存。作者还观察到许多其他血管特征对危险因素的潜在因果影响,但仅具有边际显著性(图5d)。

为了确定与IDPs和危险因素共同相关的基因,作者首先计算了这些成对对应基因集之间的简单交集(图6a)。识别出许多额外的多效性基因候选者(图6b, c)。观察到,对于相关基因集已经有相当大的重叠的表型对,相干基因集(图6b)往往是最大的,而对于一些相关基因没有或只有很少重叠的表型对,发现了大量的反相干基因集(图6c)。特别是DBP和中央视网膜当量的比值,血管密度和正中动脉直径的比值及其变异性。此外,中央视网膜等价物的比例与BP和BMI具有多个反相干基因。    

复制分析

作者从两个独立的较小队列中获取CFIs,即鹿特丹研究(RS, N = 8142名参与者)和OphtalmoLaus研究(N = 2276名参与者),从中计算了17个 IDPs。在两个复制队列中获得的IDPs之间的表型相关性r(p)与UKBB数据总体上一致(图7a)。

由于样本量较大,仅使用RS数据来尝试复制在UKBB中的遗传关联结果。由于RS由四个不同样本量的子研究组成,因此对每个子研究分别进行独立的GWAS,然后进行meta分析。应用LDSR估计IDP SNP遗传和基因cross-trait相关性,观察到与UKBB数据整体的一致性估计 (图7 b, c)。绘制UKBB中显著SNP与RS的效应大小(图7d)显示,绝大多数IDPs在方向上具有高度显著的相关性和一致性。然后,作者试图复制个体遗传关联。为此,采用了公认的Benjamini-Hochberg程序。在固定的FDR为0.05的情况下,在图7e所示的四个IDP中复制了195个SNP中的86个,在17个主要IDP中复制了566个SNP中的232个。    

文章小结

该研究表明图像衍生血管表型的大规模分析有足够的能力获得视网膜血管调节过程的功能和因果见解。如果你们对公共数据库和孟德尔随机化分析,只是略有了解,不清楚使用方法,但又急需发文,可以联系馆长哦~馆长这里有各种创新选题和生信分析思路,专业团队提供1V1服务,欢迎来询!  

馆长有话说

馆长会持续为大家带来最新生信思路,也可以提供特色数据库构建、免费思路评估、付费生信分析和方案设计以及实验项目实施等服务,对数据库构建和生信分析感兴趣的朋友可以咨询馆长哦!

生信分析

方案设计

服务器租赁

孟德尔随机化

网络药理学

单细胞测序

临床公共数据库分析

往期推荐

1.“药食同源”药蓄势待发!武汉理工团队:创新逆向思维,网药+分子对接,3个月速成一区TOP!

2.6分+纯生信!单细胞竟如此吃香!海南大学团队又一佳作,升级版思路基础和临床都适用!快看过来啦~

3.网药分析整新活,中医药SCI迎来大爆发!速看贵中医团队6分+新作:网药+分子对接+湿实验,轻松拿下一区SCI! 

生信图书馆
深入解读最新生信文献,分享研究思路和方法,提供专业生信分析服务,帮助您把握生物信息学的最新动态
 最新文章