本次解读的是发表在LANCET子刊eClinicalMedicine(IF=9.6)上的一篇文章《Novel type 2 diabetes prediction score based on traditional risk factors and circulating metabolites: model derivation and validation in two large cohort studies》,本研究旨在评估在临床使用的糖尿病风险评分(CDRS)基础上添加代谢组学生物标志物对评估2型糖尿病10年风险的增量预测价值。
01背景介绍
二型糖尿病的全球患病率呈显著上升趋势,与死亡率增加、生活质量下降和巨大的经济负担相关。鉴于预防措施在缓解或延迟疾病发作方面的有效性,早期识别高风险个体至关重要。尽管目前预测二型糖尿病风险的模型有效地区分了未来风险低和高的个体,但由于缺乏特异性和复杂风险因素的不完全描述,它们的临床适用性受到限制。
代谢组学的最新进展,特别是通过使用核磁共振(NMR)光谱,为二型糖尿病的早期检测提供了有希望的见解。核磁共振波谱技术支持全面的代谢组学分析,包括其在单次分析中测量多种代谢物的能力,提供了对二型糖尿病之前代谢紊乱的更细致的观察。此外,核磁共振波谱的高通量性质,加上其低操作成本和最小的批次间差异,使其成为大规模流行病学研究的理想工具。
尽管代谢组学具有增强风险预测模型的潜力,但以前的研究往往局限于研究少量或单一亚类的代谢组学生物标志物,使得代谢组学分析在预测二型糖尿病风险方面的价值不确定。这项研究是第一个旨在在两个大型的、以人群为基础的队列研究中推导和外部验证基于核磁共振代谢组学数据的二型糖尿病风险评分的研究。
02材料与方法
01 研究人群
英国生物银行(UKB)是一项大型前瞻性队列研究,共有502493名参与者,年龄在37-73岁之间,从2006年3月13日至2010年10月1日在英格兰、苏格兰和威尔士的22个评估点招募。ESTHER研究是一项正在德国西南部的萨尔州进行的基于人群的队列研究,共有9940名参与者,年龄在50-75岁之间。招募发生在2000年7月1日至2002年6月30日由全科医生进行的标准健康检查期间。此后每两到三年进行一次随访。分析研究人群的纳入和排除标准如所示图一。
02 代谢组学分析
高通量NMR代谢组学平台用于测量UKB参与者随机选择的基线血浆样本中的250种代谢物,以及来自ESTHER队列的具有足够血液样本质量的所有基线血清样本。甘油被排除在外,因为它在两个队列的大多数参与者中无法测量,剩下N = 249种代谢物用于分析。
03 代谢物选择和模型推导
为了稳定方差并减少异常值的影响,所有代谢物的浓度都进行了对数转换。对数转换后,将代谢物值换算成每个组群内的标准差单位,便于对不同分布的代谢物进行比较。UKB队列被分为训练集(70%)和测试集(30%)。ESTHER作为外部验证集。LASSO Cox比例风险模型使用每个bootstrap样本中的最佳λ进行拟合。研究记录了选择哪些代谢物,因为它们在每个bootstrap样本的最终Cox比例风险模型中具有非零系数。在1000个bootstrap样本中,通过LASSO选择的代谢物至少有95%被选择,这是之前显示的一个阈值,用于增强模型的可推广性并最小化模型的过度拟合。选定的代谢物随后被纳入临床CDRS,以构建一个新的预测模型。
04 验证模型的预测性能
30%的UKB子样本用作测试集,ESTHER研究用作外部验证集,以评估衍生模型的预测性能。研究评估了受试者工作特征曲线(ROC)。使用Harrell的C指数评估区分度,使用500个重样本的bootstrapping估计置信区间。基于每种所选代谢物的增量预测值,研究额外开发了一个简明版的UKB-DRS,使用临床CDRS变量,并且仅使用那些在外部验证队列中C指数显著增加(P>0.005)的代谢物。评估连续净重新分类指数(NRI)和综合歧视指数(IDI)以评价风险重新分类。连续NRI的范围从-2到2,其中0表示无净重新分类改进,正值表示改进的重新分类,负值表示较差的重新分类。此外,通过将每种所选代谢物单独添加到临床CDRS模型中,分别评估它们的C指数变化、NRI和IDI。所有这些分析都是针对内部验证集和外部验证集进行的。
05 选定代谢物与二型糖尿病事件的关联
为了得出选定代谢物10年二型糖尿病风险的风险比(HRs)和95%置信区间(CI),将代谢物分别添加到测试集和外部验证集中的Cox比例风险回归模型中。使用r-package对这些模型进行了CDRS变量的调整幸存。以对数转换和标准化格式,随着代谢物浓度每增加一个标准差(SD),估计HR和95%CIs。对数变换用于消除代谢物浓度分布的偏斜。随后将平均值标准化为0,标准差为1,以促进具有不同单位和规模的代谢物之间的可比性。
03结果
01 基线特征
表1总结了UKB队列中86232名参与者和埃丝特研究中4383名参与者的临床CDRS变量的特征。两个队列的平均年龄和性别分布相似,UKB的参与者平均年龄为59.9岁(SD:4.4),男性占44.3%。在ESTHER队列中,平均年龄为60.2岁(标准差为5.5),42.7%的参与者为男性。此外,身体质量指数和HbA1c水平相当。与UKB相比,ESTHER研究的参与者中有更高比例的人目前吸烟(ESTHER为17.5%,UKB为9.3%),更多的人有糖尿病家族史(36.9%,16.8%),更多的人服用抗高血压药物(ESTHER为37.8%,UKB为13.3%)。类固醇处方在两个队列中同样罕见(ESTHER为0.8%,UKB为1.3%)。
02 选定代谢物与二型糖尿病事件的关联
在长达10年的随访中,UKB的86232名研究参与者中有3537人患糖尿病,ESTHER研究的4383名参与者中有495人患糖尿病。通过LASSO分析和bootstrapping,选择了11种代谢物来增强训练集中临床CDRS对二型糖尿病风险的预测能力。这些代谢物包括四种糖酵解相关代谢物(柠檬酸、葡萄糖、乳酸和丙酮酸)、两种酮体(3-羟基丁酸和乙酸)、两种氨基酸(谷氨酰胺和酪氨酸)、两种脂蛋白相关代谢物(IDL-CE-pct(胆固醇酯占总脂质的IDL百分比)和M-LDL-TG-pct(甘油三酯占总脂质的中等LDL百分比))以及一种脂肪酸相关代谢物LA-pct(亚油酸占总脂肪酸的百分比)。图2以对数转换和标准化格式显示所选11种代谢物的皮尔逊相关矩阵,将它们的分布转换为接近正态分布。糖酵解的三个生物标志物,丙酮酸、葡萄糖和乳酸,彼此高度相关(在ESTHER和UKB,丙酮酸和乳酸的一对一Pearson> 0.5)。此外,三种脂蛋白相关生物标志物M-LDL-TG-pct、IDL-CE-pct和LA-pct在两个队列中高度相关(所有皮尔逊相关系数均> 0.5)。除了这两个生物标志簇,相关性为低到中等。
11种选定的代谢物单独(没有任何协变量,如年龄和性别)已经很好地预测了未来10年的糖尿病发病率,内部验证集中的C指数(95% CI)为0.733 (0.715,0.750),外部验证集中的C指数为0.735 (0.713,0.757)。图3显示了在UKB和ESTHER队列的测试集中,11种选定的代谢物和偶发二型糖尿病之间的关联,以图形方式对临床CDRS的变量进行了调整。除酮体3-羟基丁酸盐和乙酸盐外,所有生物标记物均与UKB的二型糖尿病显著相关。除了可信区间不重叠的3-羟基丁酸盐,ESTHER研究中的结果非常相似。柠檬酸盐和丙酮酸盐的结果也是可比较的,尽管这些生物标志物在ESHTER的研究中缺乏统计学意义。
03 代谢组学生物标志物对二型糖尿病风险预测的改进
在训练集中,临床CDRS的C指数[0.830 (0.821,0.839)]远高于CDRS的C指数[0.740 (0.731,0.749)]。因此,本研究比较了新的临床CDRS模型的预测性能,该模型仅扩展了11种代谢物和临床CDRS。本研究在下文中将这种新型模型称为“英国生物银行糖尿病风险评分(UKB-DRS)”。在训练集、测试集和外部验证集中,UKB-DRS的C指数(95%置信区间)始终显著高于临床CDRS(P < 0.001),C指数分别提高了0.017、0.019和0.028个单位(见表2)。
受试者工作特征曲线(ROC)如图4所示。此外,观察到风险分层能力的改善,在内部验证中,连续NRI (95% CI)为39.8% (34.6%,45.0%),IDI (95% CI)为0.0216(0.0170,0.0262),在外部验证中,连续NRI为33.8%(26.4%,41.2%),IDI为0.0016(0.0012,0.0019)。补充文本S3提供了如何在连续NRI (95% CI)为39.8%(34.6%,45.0%)时得出的计算结果。临床CDRS和UKB-DRS的模型校准在内部和外部验证集中表现良好,置信区间带重叠。
为了验证葡萄糖是否是模型改进的主要来源,研究将UKB-DRS的预测性能指标与以葡萄糖为参考模型的临床CDRS进行了比较。与添加了葡萄糖的临床CDRS相比,UKB-DRS的C指数(95%置信区间)更高,内部验证集为0.834(0.820,0.847)对0.820(0.805,0.834),外部验证集为0.798(0.779,0.817)对0.773(0.755,0.791)。同时,UKB-DRS的NRI(95%置信区间)在统计学上更为显著,内部验证集为26.3%(21.2%,31.4%),外部验证集为13.2%(7.1%,19.2%)。
为了进一步探索添加11种代谢物是否对特定亚组特别有用,本研究根据年龄、性别、肥胖和临床CDRS风险进行了亚组分析。在内部和外部验证中,UKB-DRS在所有亚组中始终优于临床CDRS。没有特别低或高C指数变化的亚组。
图7说明C-index的增量改进,以及补充表S611种选定代谢物纳入内部和外部验证的临床CDRS后,每种代谢物的NRI和IDI。特别是葡萄糖、IDL-CE-pct、LA-pct和M-LDL-TG-pct增强了外部验证队列中C指数变化> 0.005的两个队列中模型的区分能力。其他七种代谢物最多显示出C-index的低增加。因此,本研究另外开发了一个简化的模型,称为简明UKB-DRS,它只包含这四种关键代谢物(葡萄糖、IDL-CE-pct、LA-pct和M-LDL-TG-pct)以及传统的CDRS变量。内部验证的C-index(95% CI)为0.830 (0.815,0.844),外部验证的C-index为0.786 (0.766,0.805),与完整的UKB-DRS相比,简明的UKB-DRS具有相当的区分性能,包括11种代谢物。图4显示,与完整UKB-DRS的ROC曲线相比,简明UKB-DRS的ROC曲线几乎相同(在内部验证中)或稍低(在外部验证中)。简明UKB-DRS在内部验证(分别为36.7 (31.4,41.9)和0.0205 (0.0162,0.0248)和外部验证(分别为24.4 (16.7,32.2)和0.0011 (0.0008,0.0015))中的NRI (95% CI)和IDI (95% CI)也比完整的UKB-DRS稍弱。
04小编说明
小编说明:
研究存在一定的局限性。尽管研究仅纳入了有初级保健记录的UKB参与者以确定二型糖尿病的发生率,但其发生率仍显著低于ESTHER研究。这种差异可能是由于UKB的漏报和ESTHER研究中更完整的确定,在ESTHER研究中,研究参与者的全科医生被要求提供他们的医疗记录,并对这些记录进行糖尿病诊断和降糖药物的筛选。此外,两个队列在血液样本方面也存在差异。UKB使用血浆和ESTHER血清样本来确定代谢物。此外,在英国生物库队列中,只有一小部分血液样本是在禁食条件下采集的,即至少8小时不吃不喝(3.3%),而ESTHER研究中的大多数参与者都没有禁食(90.6%)。
虽然UKB-DRS的C指数相对于单独的临床CDRS的绝对改善是适度的,但这种改善在临床上是有意义的,原因有几个。首先,当应用于大规模人群时,即使风险预测模型的辨别能力有很小的提高,也会对人群产生实质性的影响。在二型糖尿病的情况下,更早和更准确地识别处于危险中的个人可以实现及时的干预策略,每年潜在地防止数千例病例。第二,在临床环境中,使用代谢组学生物标志物作为传统风险因素的辅助手段,可能有助于对以前低估或高估了患糖尿病风险的个体进行重新分类。在这种情况下,中度增加的持续NRI > 30%的UKB-DRS比中度C指数增加更具有临床相关性。这些重新分类可以完善与生活方式干预或药物治疗相关的决策过程。最后,本研究中选择的代谢组学生物标志物来自NMR光谱,这是一种高通量和经济高效的平台,与液相色谱串联质谱(LC-MS/MS)相比,更适合用于大规模临床常规设置。在这种情况下,仅添加4种代谢物的简明UKB-DRS可能是最具成本效益的方法。
结语
临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题,同时,为即将发生的临床难题提供备选解决方案。
打开极智分析—智能医学统计分析平台 https://www.xsmartanalysis.com/ 进行实操吧!
往期精彩回顾
【1】【直播预告】旧指标也能变废为宝,MR联合Nhanes解锁发文新思路
【2】Nature子刊:基于蛋白质的机器学习预后模型用于对儿童乳头状甲状腺癌患者进行分层
【3】CARDIOVASCULAR IMAGING(IF=12.8):基线分析+模型解释性+生成分析=NICM右心室功能障碍的预后意义
【4】《Eur J Heart Fail》IF=16.9,如何识别高危糖尿病心肌病表型?新开发和验证的机器学习的方法帮助解决!
扫二维码
关注我们
公众号|极智分析
知乎|极致分析
B站|极智分析