引言
阿尔茨海默病(AD)和肥胖症的患病率同时上升。本研究考察了影响代谢的因素、种族/民族以及性别是否与AD的发展有关。
方法
分析包括2012年1月至2023年10月在加利福尼亚大学六家医院确诊的65岁及以上AD患者。对照组为无痴呆的种族/民族、性别和年龄匹配者。数据分析采用Cox比例风险模型和机器学习(ML)。
结果
与白人相比,西班牙裔/拉丁裔和夏威夷原住民/太平洋岛民患AD的风险增加,但黑人并非如此。非传染性肝炎和酒精滥用是显著的 hazards,且酒精滥用对女性影响大于男性。虽然体重不足增加了AD风险,但超重或肥胖降低了风险。ML确认了代谢实验室检测在预测AD发展中的重要性。
讨论
数据强调了代谢在AD发展中的重要性,以及需要针对种族/民族和性别制定特定的预防策略。
亮点
与白人相比,西班牙裔/拉丁裔和夏威夷原住民/太平洋岛民显示出增加的AD风险。
体重不足个体与正常体重指数个体相比,AD的风险比显著更高。
肥胖与AD风险的关联在不同种族群体中有所不同,老年亚裔个体比白人显示出增加的风险。
酒精消费和非传染性肝炎是AD的重要 hazards。
机器学习方法突显了代谢面板在AD预测中的潜力。
本研究使用了加利福尼亚大学健康数据仓库(UCHDW)的符合健康保险流通与责任法案(HIPAA)的健康数据,这些数据来自六个卫生系统。数据由数据驱动洞察与创新中心使用观察性医疗结果合作伙伴关系通用数据模型(OMOP)版本5.1建立、维护、提取和协调。通过OMOP,不同的临床数据可以使用标准数据结构以及医学词汇表编译到一个UCHDW中,例如逻辑观察标识符、名称和代码;处方规范;以及系统化医学名词。目前,UCHDW的OMOP数据库包括942,483名在2012年1月1日之后至少有过一次就诊的患者。
本研究确定了2012年1月1日之后被诊断为阿尔茨海默病(AD)且年满65岁的患者,这些患者的数据基于与AD相关的国际疾病分类(ICD)-9/10代码被识别。根据HIPAA规定,年满89岁的患者年龄被设定为89岁。这些患者被标记为“AD”病例。具有颅内损伤、遗传易感性或早发性AD病史的AD患者被排除在外。研究共纳入了23,182名AD患者(年龄≥65岁),其中62.29%为女性,这些患者的平均年龄为85.14 ± 5.33岁。
对照组由166,931名年满65岁且未患有AD、轻度认知障碍、颅内损伤或遗传易感性的患者组成,这些患者与AD患者按种族/民族进行了随机匹配。图1和图2提供了纳入和排除标准的详细概述。
研究分析了60个变量,这些变量分为三个类别,以评估它们对AD发展的影响。第一类包括人口统计信息:年龄、性别、种族/民族、地区剥夺指数(ADI)、加州大学机构、以及BMI。具体来说,ADI在人口普查区块组级别汇总了各种社会经济数据(例如收入、教育、就业、住房质量),以衡量发生在邻里层面的社会经济劣势。等级1表示非常低的劣势,而10代表加州最高的社会经济劣势水平。第二类包括影响代谢功能的疾病,如非酒精性脂肪性肝炎或自身免疫性肝炎、饮酒、代谢性疾病以及2型糖尿病(T2DM)和心血管疾病(CVD)。在机器学习的背景下,变量被称为特征。
基准评估指标
我们的分析显示,患有严重肝病的患者在77岁之前就死亡的风险增加了6到7年,77岁是我们研究队列中AD诊断的中位年龄。患有肝癌、肝硬化或有毒性肝病的患者的平均死亡年龄分别为73岁、72岁和74岁。为了减轻死亡率对分析的影响,并确保有足够的实验室数据和随访时间,我们决定将年龄 cutoff 设定在70岁。统计分析是使用34,277名在69岁之前至少访问过一次加州大学机构,并且在70岁时仍然存活且未患有AD的患者进行的。在这组患者中,有866名患者在70岁之后被诊断出患有AD。
基于最终随访状态的数据特征展示在表1中。AD发生的时间(以70岁为时间0)使用Cox比例风险模型进行建模,将失访或死亡视为删失事件。Cox比例风险模型被用来研究AD发生的时间,并解决控制组患者可能会因为更长时间的随访而最终发展为AD的问题。在不调整协变量的模型中,研究了人口统计学(性别、种族/民族)和ADI对AD诊断的影响。当评估BMI对AD诊断时间的影响时,对性别、种族/民族、ADI和加州大学机构进行了调整。分别使用每个受试者70岁之前的最低和最高BMI进行分析。通过包含变量与种族/民族和性别之间双向交互效应的模型,检查了特定变量对AD影响在种族/民族和性别之间的差异。当评估医疗诊断对AD发生时间的影响时,模型考虑了以下协变量:性别、种族/民族、ADI和加州大学机构。使用Bonferroni校正对诊断的p值进行了调整。
通过使用在单变量分析中显著(调整或原始p值<0.05,视情况而定)的变量,我们拟合了一个多变量Cox比例风险模型,研究阿尔茨海默病(AD)发生的时间。这个模型包括了酒精、非传染性肝炎、最大体质指数(基于种族的)、性别、种族、溃疡性结肠炎(UC)发病部位和ADI等变量。由于与最大种族体质指数高度共线性,我们没有包括最小种族体质指数和非种族体质指数的最小值。
为了研究实验室检测变量对AD发生时间的影响,我们在模型中使用了70岁前每个实验室指标的最小值或最大值(在单独的模型中)。模型包括了性别、种族/民族、ADI和UC机构作为协变量,并对缺失数据采用了逆概率加权。
为了校正多重测试带来的假阳性,我们对不同实验室变量进行了Bonferroni校正。
所有的统计分析都是使用R版本4.2.2在Databricks平台上的Spark分析环境中进行的。
机器学习
与主要研究单一变量对阿尔茨海默病发病时间影响的统计模型不同,机器学习(ML)分析纳入了60个变量/特征。为了研究不同特征/变量的影响,实验室检测被分为五组:(1)代谢组,(2)血液计数,(3)血清脂质,(4)血糖,以及(5)心脏功能。每组被移除以评估其对ML模型性能的影响。
为了考虑患者检测频率和就诊时间的变化,阿尔茨海默病(AD)患者的每个特征值基于他们确诊前3年的最后一次实验室检测结果。对于对照组受试者,每个特征值对应他们最后访问前3年的最后一次实验室检测数据。选择3年时间框架是为了在保持足够样本量进行分析的同时,能够预测AD。根据这一标准,研究包括了503名AD患者;每位患者都有所有60个特征的数据。为了构建一个平衡的数据集,对照组患者包括503名随机选择的年龄和性别匹配的患者。表2显示了用于机器学习分析的AD和对照组的基线人口统计信息。
在数据处理步骤中,对分类变量使用独热编码,将每个类别转换为二进制向量表示。这种数据处理确保分类数据能够有效地纳入分析中,并避免了序数假设。对于数值变量,应用了最小-最大归一化,将值缩放到一个定义的范围,即0和1,以确保模型中的一致性处理。所有模型都使用Databricks中的Scikit-learn版本0.20进行。
实施了十折交叉验证,这是一种比训练/测试分割更可靠的模型性能估计方法,可以减少偏差和方差。数据集被随机打乱并分成十个折叠。在每个折叠中,模型在九个折叠上进行训练,在剩余的折叠上进行测试。这个过程重复进行,直到所有十个折叠都用于测试。计算所有迭代的平均分类准确度和标准差(SD),以确定每种算法的性能。
统计分析的研究人群包括34,277名患者,其中33,411名在最后一次随访时没有诊断为阿尔茨海默病(AD),866名被诊断为AD。平均年龄为72.5岁(标准差=3.92)。AD患者的平均年龄为75.8岁(标准差=2.04)。女性占总体人口的60.5%,在对照组和AD组中的分布相似(分别为60.5%和61.3%)。在机器学习分析中,1006名受试者平均分为AD患者和对照组(每组各503名),两个队列的平均年龄均为82.9岁(标准差=5.2)。AD组和对照组在性别分布上完全相同,其中女性占64.2%。
不同的种族/民族群体有不同的饮食习惯和生活方式,这可能有助于AD的发展。表3显示了性别、种族/民族和ADI对AD诊断时间的单变量Cox比例风险分析。与白人相比,西班牙裔/拉丁裔(p = 0.013)和夏威夷原住民/太平洋岛民患AD的风险增加(p = 0.001)。然而,性别或ADI与AD发病时间无关(表3)。支持信息中的表S7显示了根据人口统计信息以及酒精和非传染性肝炎的多变量Cox比例风险模型对AD时间的分析结果。在模型中调整变量后,西班牙裔或拉丁裔种族和夏威夷原住民或太平洋岛民相对于白人患AD的风险更高。
晚年BMI对AD的影响
我们研究了BMI的最大值和最小值,以评估BMI(基于疾病控制与预防中心[CDC]指南)的影响,因为BMI值波动较大。在调整了性别、种族、ADI和UC站点后,Cox比例风险模型显示,至少一次评估体重过轻的人比正常BMI的人有显著更高的风险比(HR)(p ≤ 0.001)。相比之下,无论是使用最大值还是最小值,超重或肥胖都降低了HR,表明有保护作用(表3)。然而,亚洲受试者显示肥胖与超重相比,AD的风险显著增加,这与使用最大BMI建模时白人群体中发现的小的保护效应显著不同(p = 0.021,表4)。相反,在模型中使用最小BMI时,不同种族之间的AD风险没有显著增加。
我们研究了肝脏功能障碍是否可能成为AD的风险因素。此外,还检查了其他与代谢相关的健康问题,包括2型糖尿病(T2DM)和心血管疾病(CVD),以及饮酒(表5)。非传染性肝炎(HR = 5.181)和饮酒(HR = 2.595)通过使用AD时间的单变量Cox比例风险模型都是显著的风险因素(调整后的p值<0.001,表5)。尽管有毒肝病和T2DM的HR升高,但它们没有达到统计学意义。用于诊断饮酒和非传染性肝炎的ICD-10代码分别在支持信息中的表S9A、B中列出。
代谢面板作为阿尔茨海默病预测的新数据来源
我们使用了五种机器学习方法,即逻辑回归、线性支持向量机、决策树、随机森林和梯度提升决策树(GBDT),以确定所研究的变量是否具有预测阿尔茨海默病(AD)诊断的能力。支持信息中的表S12显示了在平衡的机器学习数据集上使用10折交叉验证评估的五种算法的平均分类准确率和标准差。当包含所有60个变量时,GBDT算法在AD预测中达到了62.43%的最高准确率,超过了随机猜测所期望的50%准确率。然而,当仅包含人口统计信息(年龄、性别、种族/民族、ADI、UC机构和BMI)时,所有五种算法的AD分类准确率均约为50%。这表明病例对照的年龄-性别匹配策略在减轻与人口统计相关的AD分类影响方面的有效性,从而增加了识别其他相关风险因素(如诊断和实验室检测)的潜力。
有趣的是,比较排除疾病诊断与实验室检测数据时,排除实验室检测数据的预测能力往往较低。这一发现提示了实验室检测数据在AD预测中的相对重要性。因此,我们进一步分析了实验室检测,将其分为五类(见表S6)。选择GBDT是因为其提供的预测能力优于其他方法。结果显示,排除代谢面板实验室检测数据后,平均准确率为54.88%,相比于包含所有变量时的62.43%下降了约7.55%(见表6)。后续的t检验结果产生了p值为0.0003,超过了预设的显著性阈值0.05,表明包含代谢面板实验室数据后,预测能力有统计学上的显著增强。这一发现表明,代谢面板有潜力作为AD预测的新数据来源。
排版:王倩倩
文字:王倩倩