高分综述解读--机器学习在心力衰竭诊断、预测和预后中的应用

文摘 2024-12-19 12:00 北京

摘要

全球范围内，心血管疾病每年导致超过1700万人死亡，主要是通过心肌梗死（MI）和心力衰竭（HF）。这项全面的文献综述检查了与机器学习（ML）背景下HF的诊断、预测和预后相关的各个方面。综述涵盖了一系列主题，包括保留射血分数的心力衰竭（HFpEF）的诊断和识别射血分数降低的心力衰竭（HFrEF）的高危患者。探索了使用不同的ML方法预测不同HF人群中的死亡率，包括ICU中的患者，以及使用生物标志物和基因表达预测HFpEF患者的死亡率。综述还深入探讨了使用ML方法预测中范围射血分数（HFmrEF）的HF患者的死亡率和住院率。研究结果强调了多维方法的重要性，该方法包括临床评估、实验室评估和全面研究，以提高我们对HF的理解和管理。包含生物标志物、基因表达，并考虑表观遗传学的有前景的预测模型显示出在估计死亡率和识别高危HFpEF患者方面的潜力。这篇文献综述为寻求全面和最新理解ML在不同亚型和患者群体中诊断、预测和预后HF角色的研究人员、临床医生和医疗保健专业人员提供了宝贵的资源。

心力衰竭的诊断

人工智能（AI）是一项技术，能够执行通常需要人类智能才能完成的任务。在心血管疾病领域，AI越来越多地被用来改变我们诊断、治疗、预测风险、为患者提供临床护理以及发现新药物的方式。Unterhuber等人利用卷积神经网络（CNN）模型区分心力衰竭患者和对照组。试验中有两个患者队列。在衍生队列中有1884名个体，他们有劳力性呼吸困难或类似症状，保留的射血分数（50%）和临床迹象表明有冠状动脉疾病。心电图被分割，总共提供了77,558个样本。欧洲心脏病学会（ESC）标准使用CNN对心力衰竭患者和对照组进行分类。来自前瞻性心衰筛查计划的203名参与者的外部队列作为CNN的验证队列。CNN显示出高辨别能力，在盲测数据集上达到了0.92的AUC值，敏感性为0.98，特异性为0.63[27]。这些发现展示了首个基于ESC标准的深度学习（DL）启用的CNN，用于检测基于NT-proBNP值的心力衰竭患者，在高危患者中的诊断算法中使用。CNN的适用性在外部验证队列中进行了评估，这些个体有发展心力衰竭的风险，筛查性能至关重要。

这些发现还强调了基于CNN的机器学习模型在心力衰竭诊断和管理中的潜力，为临床医生提供了宝贵的见解，以优化患者护理。进一步的研究和验证对于它们实际整合是必要的。在另一项研究中，Wang等人专注于使用长短期记忆网络和深度学习来识别使用大型美国全国商业保险数据集的高危心力衰竭患者。长短期记忆网络是一种循环神经网络，通常用于深度学习中的序列数据分析。例如，它可以通过分析一系列患者的生命体征和医学测量来预测心力衰竭的进展，如图2所示。

心力衰竭预测

心力衰竭伴射血分数降低（HFrEF）的死亡率

Tohyama等人强调了机器学习（ML）在利用日本行政索赔数据库（ACD）预测心力衰竭患者预后方面的有效性。ML方法的表现优于传统风险模型，促使作者开发了一个新的预测模型，称为SMART-HF。通过结合ML分析识别出的关键变量，SMART-HF展现出了相当或更优的性能，同时只需要少量易于获取的变量。这些变量可以通过简短的访谈进行评估，甚至非医疗保健提供者也可以进行，增强了模型的可用性。在考虑的ML算法中，投票分类器算法在预测心力衰竭患者的死亡率方面最为有效。该算法通过使用不同方法的多个专家聚合预测，并根据多数决定结果。通过利用投票分类器算法，心力衰竭专家可以获得更准确的预测，有助于患者护理中的决策制定。排列特征重要性技术在理解不同预测因子的重要性方面被证明是有价值的，包括心力衰竭的死亡率。这种技术涉及对单一特征的值进行洗牌，并观察其对预测准确性的影响。如果一个特征至关重要，洗牌其值会显著降低准确性。投票分类器算法在图3中有图解说明。通过利用这种技术，心力衰竭专家可以识别出预测死亡率最有影响力的因素，使他们能够优先考虑患者管理中的重要方面。Tohyama等人报告说，在评估模型根据死亡风险对心力衰竭患者进行排序的有效性时，使用了包括AUC-ROC在内的C统计量等指标。C统计量越高，表示更好地正确排序患者的能力，以预测他们的死亡概率。尽管模型之间的C统计量差异很小，但与研究中其他模型相比，SMART-HF提供了独特的优势。基于ACD的预测模型的使用也可以促进未来各种疾病中基于ML的建模研究。

机器学习（ML）算法也被其他人使用，例如，Mpanya等人利用ML预测中低收入国家心力衰竭患者的全因死亡率。他们训练了六种监督ML算法。比较了不同算法的性能，发现支持向量机（SVM）表现出理想的性能，在训练和测试期间达到了0.77的接收者操作特征曲线下面积（AUROC）和高准确率。ML算法和传统的统计逻辑回归（LR）模型识别出心力衰竭全因死亡的相似预测因子，如研究所揭示。SVM是预测心力衰竭患者结果的宝贵工具。它采用绘制线条的技术，将可能遇到特定结果（如死亡）的患者与不太可能遇到这些结果的患者分开。这条线被策略性地放置以最大化两组之间的分离，确保精确分类，在图4中有图解说明。通过利用SVM，医疗保健专业人员可以识别出有较高不良结果风险的患者，促进知情的治疗决策。这种方法能够区分心力衰竭患者中更有可能死亡的和可能性较低的，使得能够实施个性化的患者管理策略。SVM和LR模型都识别出各种临床因素作为预测因子，包括药物（如呋塞米、β受体阻滞剂和螺内酯）、体检发现（如早期舒张期杂音和胸骨旁隆起）以及合并症（如冠状动脉疾病和缺血性心肌病）。这些预测因子与之前报告临床参数与心力衰竭死亡率之间相似关联的研究一致。研究强调了数据质量的重要性，并计划通过收集撒哈拉以南非洲多个心脏中心的数据来扩大样本量，以提高模型性能。

ICU的死亡率

在一项由Li等人进行的回顾性队列研究中，开发并验证了机器学习（ML）算法，用于预测心力衰竭（HF）患者在重症监护病房（ICU）中的死亡率。研究中开发并比较了四种ML算法，即XGBoost、逻辑回归（LR）、随机森林（RF）和支持向量机（SVM）。与其他算法相比，XGBoost模型表现出更优越的性能。通过使用SHAP（SHapley Additive exPlanations）方法进一步解释XGBoost模型，增强了临床可解释性，并为决策过程提供了洞见。研究关注了一个15-25%的阈值概率范围，以防止无效的临床干预。这个范围有助于根据预测概率指导决策。设置阈值概率范围类似于建立边界以确定事件的可能性。例如，如果一个人在0.3-0.7的阈值范围内的预测概率高于0.7，那么他们被认为可能患有疾病。另一方面，如果预测概率低于0.3，则被认为不太可能。预测概率在0.3和0.7之间将被视为不确定，并需要进一步调查。这种方法简化了决策，并根据预测概率将个体分类到不同的组中，使知情行动或进一步检查成为可能。在指定的阈值范围内，XGBoost模型的表现超过了其他策略。最重要的预测变量是平均血尿素氮（BUN）水平。先前的研究也表明，在使用ML算法时，BUN是心力衰竭死亡的一个关键预测因子。BUN作为肾功能的标志，反映了心力衰竭患者的神经激素激活。然而，研究强调需要进一步研究以探索SHAP方法的适用性，因为缺乏外部验证。

在另一项研究中，Chen等人开发并验证了一个可解释的基于机器学习（ML）的风险分层工具，用于预测ICU中心力衰竭患者的住院全因死亡率。作者比较了他们的ML模型与传统风险预测方法，并强调了在ICU中心力衰竭患者中准确预后评估的临床意义。与传统的广义线性回归模型相比，ML能够从高维数据集中捕捉线性和非线性关系，这些模型未能捕捉心力衰竭中风险预测因素与死亡终点之间的复杂关系。分析和建模这类数据集需要量身定制的方法，以有效提取有意义的信息并克服维度挑战。Chen等人利用XGBoost算法开发了一个新模型，该模型考虑了临床特征、共病和药物信息。与Logistic模型和Get With The Guidelines-Heart Failure (GWTG-HF)模型相比，该模型在预测ICU中心力衰竭患者的全因死亡风险方面表现出更好的预测性能。通过LASSO筛选，作者选择了17个易于获取且具有高预测价值的变量，便于在初级医院进行风险评估。SHAP值被用来优化XGBoost模型的预测和可解释性，提供模型决策过程的视觉解释。此外，作者还开发了一个网站计算器，以帮助医生理解关键特征和预测结果。

射血分数保留的心力衰竭的死亡率

在另一项研究中，Gao等人进行了一项全面研究，探讨了循环生物标志物在因心力衰竭伴保留射血分数（HFpEF）住院患者中的预后价值。HFpEF是一种常见的心力衰竭类型，其特征是射血分数保留和舒张功能障碍。作者旨在识别能够预测这些患者全因死亡和心血管死亡风险的生物标志物。利用Cox比例风险模型，研究人员检查了各种循环生物标志物，以评估它们与HFpEF患者2年死亡风险的关联。他们发现几个生物标志物与长期死亡风险显著相关。其中一个值得注意的发现是内皮素-1（endoglin），它是转化生长因子-b的膜辅助受体。循环中内皮素-1水平的升高与炎症、内皮功能障碍、心脏纤维化和血管重塑相关联。这些发现表明，内皮素-1可以作为HFpEF患者的重要预后标志物，反映心脏损伤的严重程度并预测长期死亡风险。为了进一步提高HFpEF的风险预测，作者基于ML技术开发了一个预测模型。该模型使用支持向量机（SVM）方法实施，这是一种强大的分类和回归分析算法。结果表明，该模型能够准确预测急性HFpEF患者2年的全因死亡风险。这表明，结合基于ML的多生物标志物模型可以增强风险分层，并为管理HFpEF患者的临床医生提供宝贵的见解。多生物标志物预测模型的实际应用在临床实践中具有很大的潜力。已经存在能够使用少量血浆样本同时量化多个蛋白生物标志物的分析平台，使得多生物标志物测试对大多数患者来说既经济又易于获得。将此模型应用于常规临床实践可以改善风险评估，并有助于为HFpEF患者制定个性化的治疗策略。Gao等人的研究揭示了循环生物标志物在HFpEF患者中的预后价值。基于ML的预测模型的开发进一步增强了风险分层，为HFpEF管理中的临床决策提供了潜在的好处。在这一领域持续研究并将这些发现转化为临床实践，有望改善HFpEF患者的预后。

在另一项研究中，周等人探索了使用机器学习方法来预测因心力衰竭伴保留射血分数（HFpEF）住院患者的存活状态，这项研究特别关注HFpEF，这与以往主要关注心力衰竭总体结果的研究有所不同。他们比较了六种不同的预测模型，发现利用基因表达数据的遗传算法-核偏最小二乘（GA-KPLS）模型在预测HFpEF患者存活状态方面表现出高准确性。为了说明GA-KPLS模型，让我们考虑一个心力衰竭心脏病专家使用它来预测心力衰竭患者的再住院情况作为例子。该模型分析了各种患者因素，如年龄、血压、肾功能和药物使用情况。它识别出年龄和肾功能为最有影响力的因素。核偏最小二乘（KPLS）算法随后检查这些因素与再住院之间的关系，揭示出年龄较大的患者和肾功能受损与心力衰竭患者再住院可能性更高强烈相关，如图5所述。通过应用GA-KPLS模型，心脏病专家可以根据患者的年龄和肾功能预测哪些心力衰竭患者有更大的再住院风险。这些知识允许采取主动措施，如更密切的监测、药物调整或特殊干预措施，为这些高风险患者实施，最终减少再住院并改善患者预后。GA-KPLS模型利用核函数捕捉非线性关系，从而实现更准确的预测。这强调了机器学习技术在捕捉基因组数据中复杂模式的优势。基于GA-KPLS模型的风险预测模型的潜在应用也被讨论，包括激励患者坚持治疗、协助临床医生为高风险患者做出治疗决策，以及为未来的HFpEF临床试验设计提供信息。

赵等人开展了一项研究，旨在开发并验证一个名为HFmeRisk的风险预测模型，该模型利用弗雷明汉心脏研究（FHS）队列的数据，对早期心力衰竭伴保留射血分数（HFpEF）进行评估。HFmeRisk结合了不同方法，包括表观遗传因素和环境暴露，为早期HFpEF的风险评估提供了宝贵的见解。以HFmeRisk中使用的两种方法为例，假设我们有一个数据集，包含年龄、血压、胆固醇水平和一组患者的遗传标记等特征。LASSO算法被用来识别最相关的特征，通过将不那么重要的特征压缩至零来实现。它有助于确定哪些因素，如年龄和血压，与HFpEF风险有更强的关联，同时降低不那么重要的因素的影响。另一方面，XGBoost算法结合多个弱模型（决策树）来创建一个更强大的预测模型。它从数据中迭代学习，给予难以正确预测的样本更多的重视。赵等人报告了XGBoost如何发现特征与HFpEF风险之间的复杂关系，例如高胆固醇水平和特定遗传标记的联合影响。通过将这些方法纳入HFmeRisk模型，连同从数据模式中学习的deepFM算法，该工具为HFpEF的早期风险提供了全面评估。它为临床医生提供了宝贵的信息，以便做出明智的决策并采取预防或管理患者的心力衰竭的主动措施。

射血分数轻度降低的心力衰竭（HFmrEF）患者的死亡率和住院率

在赵等人的研究中，他们专注于为心力衰竭伴轻度降低射血分数（HFmrEF）的患者开发和验证风险预测模型，以预测心衰住院和全因死亡。HFmrEF这一心力衰竭亚型的特征是射血分数介于41%到49%之间。赵等人[36]开发了八种替代的风险模型。他们采用了机器学习（ML）技术，如随机森林（RF）和LASSO回归，来构建这些模型。这些模型结合了各种易于测量的临床风险因素，使它们在临床实践中具有实用性。研究表明，通过堪萨斯城心肌病问卷（KCCQ）评分评估的患者身体状况，是6年随访期内死亡和心衰再入院的强预测因子。将KCCQ评分与NT-proBNP（心衰的生物标志物）结合，为HFmrEF患者提供了一个快速的风险评估工具。研究强调了利用ML技术提高风险预测准确性和揭示风险因素与结果之间新关系的重要性。开发的模型在HFmrEF患者的死亡和再入院预测性能上表现出良好的预测效果。

心力衰竭患者的再入院情况

在Shin等人的研究中，比较了机器学习方法与传统统计模型（CSMs）在预测心力衰竭患者再入院和死亡方面的预测性能。研究结果表明，机器学习方法在这些预测中通常优于CSMs，其中树状机器学习算法是最常用的方法，而逻辑回归（LR）是最常见的CSM方法。机器学习在心力衰竭预后中的应用前景广阔。机器学习提供了灵活性和非参数建模的优势。非参数建模在捕获复杂关系和模式时更加灵活，不依赖于预定的数学函数或对底层数据分布的假设。以一个心力衰竭研究为例，使用各种患者特征来预测心力衰竭的风险。在参数建模中，假设特定的数学方程（如线性回归）来描述这些特征与心力衰竭风险之间的关系。然而，非参数建模采取了不同的方法，允许数据本身指导分析，使用决策树或随机森林（RFs）等技术适应数据模式。非参数模型，如决策树，可以捕获患者特征与心力衰竭风险之间复杂和非线性的关系。它们适应于可能不容易用预定方程描述的复杂关系。当真实的底层数据分布没有明确定义或关系复杂且难以提前指定时，这种适应性特别有用。

Sharma等人探索了使用行政健康数据和机器学习模型来预测心力衰竭患者在出院后30天内计划外再入院的风险。他们比较了机器学习模型与常用的LaCE评分（包括四个预测因子）的性能。机器学习模型利用更多的数据和预测因子，显示出比LaCE评分更好的预测能力。然而，研究揭示了预测心力衰竭患者的再入院，无论使用机器学习方法还是非机器学习方法，仍然是一个挑战。虽然机器学习模型优于LaCE评分，但即便是表现最好的机器学习模型作为分类器也只提供了微弱到中等的信息价值。他们报告说，结合特征重要性和影响图（如SHAP图）的机器学习模型可以通过识别与再入院风险强烈相关的变量来提供可解释性。

心力衰竭患者中主要不良心血管事件（MACE）的风险预测

Sun等人开发了一个评分系统，用于预测充血性心力衰竭（CHF）患者中主要不良心血管事件的风险。Sun等人的研究旨在开发一个适用于不同心衰人群的预测模型，专注于左室射血分数（LVEF）分析变量，而不对LVEF亚型进行分类。研究中引入了速度流图（VFM）参数到预测模型中。VFM参数分析心脏内的血流模式，并提供发展心衰的可能性见解。通过将这些参数纳入模型，可以估算心衰的风险。这些参数通过彩色多普勒超声心动图获得，使血流可视化为速度向量。模型在广泛的患者数据上进行训练，并识别与增加风险相关的模式。当输入VFM测量值时，模型提供了患者发展心衰可能性的评估。模型表现出良好的性能，并在不同风险组中显示出生存曲线的显著差异。机器学习算法，特别是XGBoost分类器，被用来分析模型的预测能力。在XGBoost分类器中包含一般参数、斑点追踪超声心动图（STE）相关参数和VFM相关参数，与其他算法相比，提高了分类准确性。

心力衰竭预后

心力衰竭（HF）的预后不佳，这一点从心力衰竭患者住院治疗和治疗试验的研究中可以看出。然而，这些知识仅适用于特定的心力衰竭患者群体。例如，很明显，心力衰竭的临床研究主要涉及男性，而且这些试验中的患者比一般社区心力衰竭患者更年轻，合并症也更少。在整体社会中，关于心力衰竭预后的信息很少；有三项研究观察了被诊断为心力衰竭的人的预后（即，普遍存在的心力衰竭，但并不总是新发病例）。此外，尽管我们的研究响应率显著（79%），但未响应可能会导致心力衰竭生存率的估计不准确，因为响应率在老年人群中较低，而且那些严重心力衰竭的患者可能更不可能参与。

田等人进行了一项研究，使用患者报告的结果（PROs）评估心力衰竭患者的预后模型。他们开发并验证了利用PRO数据预测心力衰竭患者死亡和心力衰竭再入院等事件的模型。这些模型显示出有希望的性能，并且可以轻松地在临床实践中实施，因为它们只需要在出院后收集的变量。田等人强调了PROs的预测价值，ML方法与参数调整的潜力，以及XGBoost算法在他们的研究中的优越性。他们还引入了解释性技术和基于网络的风险计算器，以增强理解和促进临床决策。这些发现为支持将PROs整合到心力衰竭患者预后模型中的不断增长的证据体系做出了贡献，最终改善了患者的护理和结果。

甘丁等人开发并比较了两种心力衰竭预后模型，这些模型针对使用电子健康记录（EHRs）的糖尿病患者，并将其性能与2型糖尿病并发症风险方程（RECODe）进行了比较。第一个模型采用了具有弹性网络正则化的Cox比例风险模型，而第二个模型使用了深度神经网络（DNN）。两种模型的性能均优于RECODe风险方程。DNN模型在区分和校准预测方面表现适中。它选择了八个协变量，这些协变量要么是RECODe方程的预测因子，要么是先前研究中确定的风险预测因子。有趣的是，DNN模型通过与心房颤动相关的ECG特征衍生的相关变量间接纳入了心房颤动。DNN模型表现出适当的校准，这对于有效的临床决策至关重要。这项研究强调了利用EHRs和AI技术为糖尿病患者开发准确的心力衰竭预后模型的潜力。这些发现为医疗保健中的预测模型知识体系的增长做出了贡献，并为糖尿病和心力衰竭患者的个性化风险评估和管理策略的进一步进步铺平了道路。

心力衰竭研究

传统的临床试验常常因为严格的入选标准、特殊环境以及对真实世界互动和治疗依从性的有限数据而缺乏普遍性。为了提供一个潜在的解决方案，D’Amario等人[44]描述了GENERATOR HF DataMart，这是一个利用真实世界数据（RWD）为心力衰竭患者生成真实世界证据的人工智能实验室。他们强调了大数据分析和人工智能在管理心血管数据的体量、速度、多样性、真实性和价值方面的需求。DataMart利用在常规临床实践中收集的RWD，提供了更广泛的实际人群代表性。使用RWD和人工智能是一个激动人心的研究领域，有潜力克服传统临床试验的限制，并提高研究结果的普遍性。然而，必须仔细考虑数据的质量、准确性和可靠性，以确保生成的证据是稳健和可靠的。

END

扫码关注

公众号：小猪的科研生活

排版：王倩倩

文字：王倩倩

小猪的科研生活

分享日常科研生活和统计以及机器学习知识

高分综述解读--机器学习在心力衰竭诊断、预测和预后中的应用

射血分数轻度降低的心力衰竭 （HFmrEF） 患者的死亡率和住院率

射血分数轻度降低的心力衰竭（HFmrEF）患者的死亡率和住院率