研究背景
最新研究揭示了两类金属与中老年人肾功能损伤之间的关系,分别具有潜在的相反肾脏效应。长期暴露于重金属(如铅、镉、汞和砷)污染环境中,可能对肾脏造成毒性损害,增加慢性肾病(CKD)的发病风险。另一方面,该研究也考察了硒和锰等营养必需的微量元素,揭示了其保护肾脏的潜在机制,这些发现为肾病的预防和治疗提供了新的视角。
技术背景
EML(Explainable Machine Learning,可解释性机器学习):EML是一种结合了机器学习模型和解释性方法的框架,旨在提供模型决策过程的透明度和可解释性。它通过使用如SHAP这样的解释性工具,将复杂的机器学习模型的预测转换为可理解的形式。
SHAP(Shapley Additive exPlanations,夏普利可加性解释):SHAP是一种基于博弈论中Shapley值的方法,用于解释机器学习模型的预测。它量化了每个特征对模型预测结果的贡献,通过为每个特征分配一个值来表示其对预测结果的影响。
MLR(Multiple Logistic Regression,多重逻辑回归):MLR是一种统计方法,用于分析多个自变量(解释变量)与一个因变量(响应变量)之间的关系,尤其是当因变量是二分类的情况。它通过使用逻辑函数将线性回归模型的输出转换为概率,然后用于预测分类结果。
BKMR(Bayesian Kernel Machine Regression,贝叶斯核机器回归):BKMR是一种先进的贝叶斯统计方法,用于评估多种环境暴露因素对健康结果的非线性和交互效应。它结合了核方法的灵活性和贝叶斯方法的统计优势,能够处理多重共线性和识别变量间的相互作用。
数据来源与研究方法
数据来源:
研究从国家健康和营养调查(NHANES)2015-2016和2017-2018年的数据中提取数据,包括参与者的血液和尿液样本中的金属浓度以及其他相关的协变量。数据的纳入标准位年龄在45岁或以上的参与者,且具有六种金属(铅、镉、锰、汞、硒和砷)及相关协变量的完整数据,共纳入1679名参与者。
研究方法:
按 CKD 分组的参与者特征比较表格。
①协变量评估
协变量选择:使用有向无环图(DAG)和相关研究确定潜在混杂因素。
连续变量:年龄、BMI和收缩压(SBP)。
分类变量:教育水平、性别、吸烟、饮酒、糖尿病、体育活动等。
糖尿病诊断标准:根据自我报告、空腹血糖和糖化血红蛋白A1c(HbA1c)水平。
肾功能评估:使用血清肌酐估算肾小球滤过率(eGFR),并根据eGFR将CKD二分化。
统计分析
描述性统计:使用中位数和四分位数范围(IQR)描述连续变量的分布,使用计数和频率表示分类变量。
比较分析:使用Wilcoxon秩和检验和卡方检验比较CKD组和非CKD组之间的人口统计学特征差异。
金属浓度转换:对所有金属浓度进行自然对数转换,并使用几何平均值描述。
多重逻辑回归(MLR)
目的:评估金属暴露与CKD风险之间的关系。
模型:首先对每种金属进行单独的MLR,然后评估金属混合物的联合暴露。
模型调整:考虑所有协变量,使用限制性立方样条(RCS)探索潜在的非线性剂量-反应关系。
贝叶斯核机器回归(BKMR)
目的:评估金属混合物对CKD风险的非线性和相互作用。
模型:使用核函数灵活地模拟混合物的联合关联。
马尔可夫链蒙特卡洛(MCMC)方法:使用MCMC方法拟合模型,确保收敛性。
结果展示:通过单变量暴露-反应、单变量暴露和双变量暴露-反应效应图展示结果。
可解释性机器学习模型(EML)
算法选择:包括随机森林、CatBoost、LightGBM、多层感知器、XGBoost和高斯朴素贝叶斯。
数据划分:80%数据用于训练,20%数据用于测试。
模型优化:通过5倍交叉验证和Hyperopt优化超参数。
性能评估:使用敏感性、特异性和AUC(接收者操作特征曲线下面积)比较模型性能。
SHAP方法:用于解释模型输出,量化特征的边际效应,评估特征之间的交互/联合效应,并计算特征重要性。
研究结论
图1: 多重逻辑回归(MLR)分析结果。
金属混合物与慢性肾病(CKD)之间的关联。A图为原始模型,B图为调整了年龄、收缩压、性别、体力活动、饮酒、吸烟、糖尿病和教育水平后的模型。图中显示了不同金属浓度四分位数与CKD风险的关联以及趋势检验的P值。
图2: 贝叶斯核机器回归(BKMR)分析结果。
揭示了金属与CKD之间的非线性关系及金属间的相互作用。A图显示了在固定其他金属在中位数时,每种金属与CKD风险的单变量暴露-反应函数。B图展示了当其他金属固定在第10、第50和第90百分位数时,每种金属浓度变化对CKD风险的影响。C图进一步展示了任意两种金属间的交互作用。
图3: SHAP(Shapley Additive exPlanations)分析结果。
展示了不同特征对LightGBM模型输出的影响。A图是SHAP特征重要性图,根据所有样本SHAP值的绝对平均值对特征进行排序。B图是SHAP摘要图,显示了变量大小和对模型预测的影响。
图4: 特征间交互效应的热图。
使用EML(优化的LightGBM)中的SHAP交互值定义了交互效应的大小。根据BKMR的双变量暴露-反应图(图2C)的斜率变化幅度和SHAP交互值的幅度,将交互作用分为三组:A组(BKMR和EML都认为是强/中等交互作用)、B组(两者都认为是小或无交互作用)、C组(两个模型结果矛盾)。
图5: 通过SHAP识别的砷(As)和锰(Mn)的主要效应和交互效应图。
A子图显示了砷对CKD的SHAP依赖图。B子图展示了在不同浓度的锰下,砷对CKD的SHAP依赖图。C子图显示了砷与锰交互作用的SHAP交互值依赖图,揭示了在不同浓度下两种金属的交互效应对CKD风险的影响。
基于以上分析结果,作者指出了下述事实:
金属与肾功能的关联:研究发现,肾毒性金属(如铅、镉、汞和砷)与中老年人群中肾功能下降呈正相关,而锰和硒这两种金属与肾功能呈负相关,表明它们可能具有保护作用。
金属间的相互作用:研究揭示了不同金属之间可能存在协同或拮抗的相互作用,这些相互作用对肾功能的影响可能比单一金属暴露更为复杂。
年龄、BMI和性别的影响:研究指出,在较高年龄、较高BMI和男性中,金属暴露对肾功能的危害可能更大,这些因素可能增加了金属暴露的敏感性。
机器学习模型的应用潜力:文章强调了机器学习模型,尤其是结合了SHAP方法的可解释机器学习(EML)模型,在研究化学混合物影响方面的潜力,特别是在定量研究相互作用和识别关键风险因素方面。
研究方法的比较:通过比较MLR、BKMR和EML三种不同的统计方法,研究突出了EML在处理化学混合物暴露研究中的优势,尤其是在考虑非线性关系和复杂相互作用时。
文章总结
本研究通过应用不同的统计方法,全面探索了六种金属与中年和老年人肾功能之间的关联。结果揭示了那些肾脏毒性金属(铅、镉、汞和砷)与肾功能下降正相关,而与锰和硒负相关。研究还发现金属之间的相互作用可能影响CKD风险。
创新点与局限性
首次将EML应用于环境流行病学中污染物共同暴露的深入研究。使用SHAP方法提供了对金属混合物影响CKD风险的深入解释。比较了EML、MLR和BKMR三种方法在评估金属混合物与CKD风险关联中的有效性。
但是,由于NHANES是横断面研究,无法确定因果关系。可能存在未调整的混杂因素,如职业和饮食习惯。同时,未加权的模型可能不完全代表美国成人人口。
拓展研究
文献推荐:
Aaseth, J., et al., 2021. The aging kidney-as influenced by heavy metal exposure and selenium supplementation. Biomolecules 11. Anyanwu, B.O., et al., 2018. Heavy metal mixture exposure and effects in developing nations: an update. Toxics
可能的潜在研究方向:
进一步研究金属混合物在不同人群中的暴露效应。
探索不同金属浓度范围内的相互作用及其对肾脏健康的影响。
使用其他机器学习方法,如深度学习,来提高CKD风险预测的准确性。
供稿:李佳旭
现在:
长按扫码关注:科研生信充电宝
转发到朋友圈,点赞30个,
截图到小编微信
或直接40元赞赏本文,即喜欢作者~
即可直接解锁:
NHANES数据库 对应资源哦~
看到这里你还不心动吗?
赶紧关注、转发、点赞、分享,领取你的专属福利吧~
好啦,以上就是今天推文的全部内容啦!
版权声明:本文内容由互联网用户自发贡献,版权归作者所有,本公众号不拥有所有权,也不承担相关法律责任。
如果您发现本公众号中有涉嫌抄袭的内容,欢迎发送邮件至:kysxcdb@163.com 进行举报,一经查实,本公众号将立刻删除涉嫌侵权内容。
微信号|科研生信充电宝
· BIOINFOR ·
永远相信美好的事情
即将发生