由5项临床指标和肝脏硬度测量组成的机器学习模型可以准确识别与MASLD相关的肝纤维化

文摘   健康   2024-07-23 01:00   江苏  

深度学习辣汤小组文献阅读学习之一百五十三篇

由5项临床指标和肝脏硬度测量组成的机器学习模型可以准确识别与MASLD相关的肝纤维化

DeepLearning 深度学习辣汤小组

 2024/1/24


2023年,来自广东省病毒性肝炎临床研究中心的Fan Rong等人开发了一个使用人口统计学/临床特征和肝硬度测量(LSM,liver stiffness measurement)的机器学习模型,用来评估aMAP评分在诊断代谢功能障碍相关脂肪性肝病(MASLD, metabolic dysfunction-associated steatotic liver disease)患者肝硬化和晚期纤维化中的作用以及提高诊断性能。并在Liver International期刊(IF:6.7 胃肠肝病学2区)上发表题为“Machine- learning model comprising five clinical indices and liver stiffness measurement can accurately identify MASLD- related liver fibrosis”的文章。

DOI:

https://doi.org/DOI:10.1111/liv.15818


一、研究背景

MASLD已成为世界上最常见的慢性肝病病因,影响了世界约30%的人口。由于MASLD可增加肝细胞癌和肝/非肝相关死亡率的风险,因此识别与MASLD相关的晚期纤维化和肝硬化对于减少并发症的发生和改善预后具有重要意义。传统的诊断方法需要进行肝组织活检,但这种方法有一定的风险和局限性。而非侵入性检查(NITs, Non-invasive tests),如纤维化- 4指数(FIB- 4, fibrosis- 4 index)、天冬氨酸转氨酶-血小板比率(APRI, aspartate aminotransferase- platelet ratio)和NAFLD纤维化评分(NFS, NAFLD fibrosis score),在不同的研究人群中呈现出相互矛盾的结果。2020年有研究团队建立一种HCC风险预测模型(称为aMAP评分),并且证实其与慢性乙型肝炎相关肝纤维化程度相关。有研究证明LSM与临床特征(称为Agile评分)相结合在诊断MASLD相关纤维化方面比LSM具有更高的阳性预测价值。这为提高纤维化的诊断性能提供了线索。

本研究通过收集临床指标和肝硬化测量数据,构建了一个机器学习模型,并评估了其在识别MASLD相关肝纤维化方面的准确性。

二、数据集

如图1所示,本研究共纳入来自中国和美国四个队列的946例经活检证实的MASLD患者,所有患者均在肝活检前或后30天内进行实验室检查。排除标准如下:(1)HCC或其他恶性肿瘤,(2)肝活检样品长度<10 mm,(3)肝炎病毒或人类免疫缺陷病毒感染,(4)其他肝脏疾病(自身免疫性肝病、药物诱导的肝病等),(5)失代偿性肝硬化(定义为肝硬化患者伴有腹水、肝性脑病或静脉曲张出血等)(6)过量饮酒(男性>210 g/周或女性>140 g/周)。并且使用配备M或XL探头的FibroScan进行LSM测量,选出828例具有可用LSM值的MASLD患者,并划分为训练集和验证集,比例约为5:1

三、方法

本研究先在四个中心由资深病理学家进行病理检查,使用非酒精性脂肪性肝炎临床研究网络组织学评分系统评估肝纤维化分期,评分F≥3被认为是晚期纤维化,F4被认为是肝硬化。采用了七种常见的机器学习算法,包括随机森林(RF)、逻辑回归(LR)、支持向量机(SVM)、Bagging、极限梯度提升(XGBoost)、K最近邻(KNN)和朴素贝叶斯(NB),用于预测肝硬化和晚期纤维化。使用aMAP评分或aMAP评分中涉及的5个指标(年龄、性别、血小板、白蛋白和总胆红素)与LSM结合作为输入特征来构建机器学习模型。并且进一步比较了单独使用aMAP、单独使用LSM和Agile评分的ML模型的诊断性能。

四、结果与总结

针对肝硬化的诊断,aMAP评分的AUROC为0.850,FIB-4的AUROC为0.857,APRI的AUROC为0.735。其中,aMAP评分的AUROC与FIB-4相仿(P=0.734),显著高于APRI(P=0.001)(见图2A)。对于晚期纤维化的诊断,aMAP得分的AUROC为0.759,FIB-4的AUROC为0.795,APRI的AUROC为0.709。尽管aMAP得分的AUROC略低于FIB-4(P=0.027),但仍优于APRI(P=0.049)(见图2B)。此外,还对所有患者的LSM和Agile评分进行了评估。LSM和Agile评分在肝硬化或晚期纤维化诊断中的AUROC值高于aMAP评分(均P < 0.05)(图2)。同时,如表1所示,当采用双截止值时,在肝硬化诊断中,aMAP相较于FIB-4和APRI,其不确定面积更小(UA, uncertainty area)且诊断准确性(DA, diagnostic accuracy)更高,分别是26.9%,86.6%比37.3%,85.0%;59.0%,77.3%。而在晚期纤维化检测中,三种NIT表现出相似的UA以及DA。

为了提高纤维化的诊断性能,本研究使用7种算法在828例具有可用LSM值的MASLD患者中建立并验证了几种ML模型。表2和图3、4描述了验证集中各ML模型肝硬化和晚期纤维化分类的结果。基本上,LSM + aMAP模型和LSM + 5指标模型在大多数ML算法中表现满意,诊断准确率较高(分别为93.6%-96.8%[肝硬化]和84.0%-94.4%[晚期纤维化])(图3)。在验证集上,通过LR算法建立起来的包含LSM以及aMAP计算器中使用的五大指标(年龄、性别、血小板计数、白蛋白以及总胆红素)的ML模型(称为LSM-plus模型)表现优异。在肝硬化及晚期纤维化识别领域,LSM-plus模型的准确性(96.8%, 91.2%)优于单独的LSM(86.4%, 67.2%)和Agile评分(76.0%, 83.2%)。

此外,LSM-plus模型不仅具有较高的特异性(肝硬化:98.3%;晚期纤维化:92.6%),而且还能呈现较高的AUROC (0.932, 0.875, respectively)和灵敏度(88.9%, 82.4%, respectively)。

综上所述,aMAP评分是一种新的、有前途的血清无创工具,用于检测MASLD患者的肝硬化和晚期纤维化。LSM- plus模型可以准确诊断与MASLD相关的肝硬化和晚期纤维化,为医生确定可能需要医疗干预的患者提供了一种可行的方法。

图1:参与本研究的患者的筛选流程图

图2:非侵入性检查诊断肝硬化(A)和晚期纤维化(B)的AUROC值

表1:NITs在诊断MASLD患者肝硬化和晚期纤维化中的作用

表2:ML模型在验证集中诊断MASLD患者肝硬化和晚期纤维化的性能

图3:验证集中,使用7种ML算法的LSM + aMAP模型和LSM + 5指数模型诊断肝硬化(A)和晚期纤维化(B)的准确率(%)

图4:验证集中使用7种ML算法的LSM + aMAP模型和LSM + 5指数模型诊断肝硬化(A、B)和晚期纤维化(C、D)的AUROC值


Pepper soup transformed by: Jin Daipeng




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向


深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章