在前期系列分享的基础上,相信大家对代谢组学有了一个初步的认识,我们代谢组思路新系列分享旨在带领大家一起洞观代谢组学科研方向和思路,理清代谢组学文章的底层逻辑。
我们会通过定期为大家总结代谢组学领域相关文献的形式,帮助大家逐步积累代谢组研究思路方面的相关知识!
代谢组学系列往期回顾:
TS
01
研究背景与应用场景
图片摘要
TS
02
研究设计
队列选择:多中心前瞻性队列研究,包括推导队列(519名接受TAVI的症状性严重AS患者,进行全面临床和超声心动图评估及代谢物分析)、多中心验证队列(286名有血样但无完整超声心动图表型分析的患者)和单中心验证队列(257名接受TAVI的症状性严重AS患者,进行代谢物分析)。
数据收集:患者临床特征(如人口统计学信息、合并症等)、超声心动图数据(12项左心室结构和功能指标)及术前血样进行代谢物谱分析。
统计分析:主成分分析(PCA)、 LASSO回归分析
· 心脏重塑复合模式生成:使用主成分分析(PCA)将12项超声心动图指标汇总为3个复合轴(体积、收缩功能、舒张功能),代表左心室重塑模式,参与者在每个轴上有一个主成分(PC)分数。
· LASSO回归分析:以PCA得出的3个分数为因变量,所有代谢物为自变量,通过LASSO回归(通过10倍交叉验证来优化超参数,R包“glmnet”),选择与每个复合轴相关的代谢物,构建“代谢物分数”模型,以找出与心脏结构/功能相关的代谢物特征,并进行通路分析评估所选代谢物的途径重要性。
在多中心推导队列中,利用221种代谢物和PCA分数进行模型训练,得到每个PC轴对应的代谢物系数。由于单中心验证队列中测量的代谢物与多中心队列不完全匹配,利用两个队列中重叠的78种代谢物重新拟合模型,得到适用于单中心验证队列的系数,用于生成3个代谢物分数。
代谢物分数生成:根据LASSO模型中代谢物的系数,计算每个参与者基于代谢物的分数(作为PCA复合轴的血液替代指标),用于后续分析。
通路分析:使用MetaboAnalyst 5.0(以KEGG代谢组为参考)和文献搜索,评估所选代谢物的通路重要性。(点击跳转通路富集分析 | 第6期. 富集分析,代谢组学也要有)
TS
03
研究结果与应用
3.1 研究结果
基于PCA的心脏重塑复合轴定义:通过PCA确定3个主成分,解释了65%的数据方差。第一个PC主要加权于左心室体积和射血分数(标记为“体积”);第二个PC更侧重于每搏输出量指数和射血分数(“收缩功能”);第三个PC主要与E/e′和左心房体积相关(“舒张功能”)。
图1 PCA确定主成分与个体间异质性
AS中心脏结构/功能的代谢特征:
代谢物选择与评分:在多中心推导队列的LASSO模型中,共选择了60种独特的代谢物(见图S4、表S1)。这些代谢物包括之前在心脏结构和代谢中被涉及的物质(如长链酰基肉碱、支链氨基酸等),以及许多此前未被报道与心力衰竭(HF)或主动脉瓣狭窄(AS)相关的物质。
图S4 循环代谢物与超声心动图主成分的关系
表S1 代谢物与LASSO超声心动图参数的相关性(部分)
代谢物分数与PC分数的相关性:代谢物分数与它们对应的PC分数之间存在中等程度的相关性(见图S5)。
图S5 代谢物评分与PC分数的相关性
代谢物评分与共病相关:代谢物分数与年龄仅存在弱相关性,减少了该因素作为混杂因素的可能性反映PC3(舒张功能)的代谢物分数与多器官功能障碍指标相关(见图3)。较高的PC3代谢物分数与较高的尿酸(全身炎症标志物)、较低的血红蛋白以及较低的身体和肺功能相关(Benjamini - Hochberg错误发现率<5%),这表明心脏风险相关的循环代谢物可能反映了额外的全身共病情况,进而可能解释了这些代谢物模式在经导管主动脉瓣植入术(TAVI)后的预后表现。
图3 代谢物评分与共病相关
代谢通路富集分析:对所有确定的代谢物分数中的52种具有人类代谢组数据库(HMDB)标识符的代谢物进行通路分析,发现了几个关键的富集通路(见图S7),如精氨酸代谢(与一氧化氮代谢有关)和泛酸及辅酶A代谢(对有氧代谢通量至关重要),此外还有一些此前未广泛涉及心脏重塑的通路,这提示了新的研究方向,即这些通路可能在心脏重塑过程中发挥重要作用,但此前未被充分认识。
图S7 代谢物评分通路分析
3.2 临床应用潜力——危险分层
识别高危患者:研究通过LASSO回归确定了与心脏结构/功能相关的代谢物特征,尤其是与舒张功能相关的代谢物分数(PC3),在调整多种临床风险因素后,仍与经导管主动脉瓣植入术(TAVI)后的死亡风险显著相关(调整后风险比为1.54,95%CI为1.25 - 1.90,P < 0.001)。 这一结果表明,通过检测这些特定的代谢物分数,可以在TAVI术前更准确地识别出术后死亡风险较高的患者,有助于临床医生提前制定更个性化的治疗和管理方案。
总结一下,本期我们以具体文章为例,简要介绍了代谢组学+LASSO回归分析用于识别代谢物模式、构建模型、计算代谢物分数、通路富集分析,从而识别高危患者。
主要方法是:
1. 通过多元统计分析呈现心脏重塑复合模式
2. 通过LASSO回归分析确定与心脏结构/功能相关的代谢物特征
3. 通过通路富集分析锁定进一步研究的通路并评估所选代谢物的通路重要性
后期我们将继续带着大家一起从浅入深地接触、理解、掌握代谢组学!
期待已久~|R语言与组学互助交流群来啦!
(欢迎大家入群交流~
若群满,请添加下方微信,备注:“R语言与组学_互助交流群” )