基于NASH患者肝脏活检中的肝细胞气球样变引入持续同源性图像,实现计算机辅助NASH诊断

文摘   其他   2024-07-16 00:02   江苏  

深度学习辣汤小组文献阅读学习之五十五

基于NASH患者肝脏活检中的肝细胞气球样变引入持续同源性图像,实现计算机辅助NASH诊断

DeepLearning 深度学习辣汤小组

 2022/9/25 


2020年,来自日本国立大学旭川医科大学的Takashi Teramoto等人在病理诊断中引入持续性图像作为新颖的数学描述符对气球样变进行分类,此外,为实现非酒精性脂肪肝亚型分类,还提出并验证了一种结合线性机器学习技术的拓扑数据分析方法,并在Computer Methods and Programs in Biomedicine(IF:7.0271)期刊上发表题为“Computer-aided classification of hepatocellular ballooning in liver biopsies from patients with NASH using persistent homology” 的文章。

DOI:

https://doi.org/10.1016/j.cmpb.2020.105614


一、研究背景

在2010年代,日本的肝癌发病率和死亡人数开始下降。这是因为由于抗病毒治疗的显著进步,由乙型或丙型肝炎病毒感染引起的慢性肝炎和肝癌的发生率大大降低。相比之下,非乙型和非丙型肝癌发生率有所增加,占原发性肝癌的50%以上。特别是,非酒精性脂肪性肝炎(NASH ,Non-Alcoholic SteatoHepatitis)。NASH作为一种进展性的肝脏疾病一直备受关注。

脂肪肝影响了30%以上的日本成年男性,因此准确诊断非酒精性脂肪肝(NAFLD ,Non-Alcoholic Fatty Liver Disease)是一个重要的问题。NAFLD被分为两类,NASH和非酒精性脂肪肝(NAFL ,Non-Alcoholic Fatty Liver)。近20%的NAFLD是NASH,它倾向于发展为肝硬化以及导致死亡的晚期肝病,如肝衰竭和肝细胞癌,所以,在患有NAFLD的患者中准确诊断出NASH是至关重要的技术。在用于区分NASH和NAFL的Matteoni分类法(名解1)中,NAFLD被分为四个亚型,1型只存在脂肪变性,在本研究中被称为NAFL1, 2型存在脂肪变性以及小叶炎症,在本研究中被称为NAFL2,3型和4型在本研究中被归类为NASH。而NASH与NAFL1和NAFL2的区别在于,NASH多存在了气球样变,因此肝细胞气球样变成为诊断NASH的一个重要的组织学参数。

在肝脏活检中评估NAFLD亚型的病理学标准仍不确定,所以作者在病理诊断中引入持续性图像作为新的数学描述符来分类气球样变。其可以作为描述符的原因具体体现在,可以通过持续同源性图像计算沉积在肝细胞上的脂肪液滴白色 "洞 "的数量,并获取气球样变的形态学特征。这种气球样变的肝细胞与肝细胞中的正常脂肪滴比较具有明显灰度梯度特征如图1所示。在此基础上,本文搭建了一个基于持续同源性和机器学习模型的分类框架。研究表明这个框架在基于患者的肝脏活检图像对NAFLD患者进行亚型分类任务上具有相当高准确性。

二、数据集

本文实验数据来自从2002年到2019年获得的79份肝脏活检标本。这些样本来自于临床或组织学诊断为NAFLD的患者,并且样本都用HE染色进行形态学检查,其中12例为NAFL 1型,19例为NAFL 2型, 45例为NASH,另外选取5例没有脂肪变性的病例被用来作为对照。使用NanoZoomer S360型号的数字切片扫描仪(名解2)对样品进行数字化。数字化后的图像使用NDP view2观看软件,放大倍率×10,分割成1920 × 1081像素的jpeg图像。根据Matteoni分类对NAFL1、NAFL2和NASH的分类依据,三组样本(NAFL1、NAFL2和NASH)各准备了99张组织图片,其中,组织图片中分别包含脂肪变性、小叶炎症和气球样变。并准备了39张不含脂肪变性组织图片作为对照组(CR)。

三、方法

肝脏活检标本经扫描数字化后获得数字图像数据,应用拓扑数据分析提取数字图像的几何特征,再结合机器学习进行NAFLD亚型的分类。研究步骤主要分为三步,(1)从组织图像数据中形成持续性图像;(2)持续性图像转化为的有限维矢量;(3)将矢量与病理学家打分一起输入机器学习模型,如图2所示。在第一步中,每个组织图像将转化为灰度位图并设置图像大小为800×600,再使用直方图均衡化后设置图像强度范围为0到255之间。然后图像再经过子级集过滤和DIPHA算法(名解3)获得p维持续性图像PDp  。在第二步时,将已经获得的[0,255]2中的多组点PDp 转为PIp(x, y),PIp(x, y)是 (x, y)平面上高斯分布的加权和,再通过设定一系列参数,可将PIp(x, y)离散成一个有限维度的矢量。组织图像和持续性图像如图3所示。最后一步,将病理学家依据Matteoni分类方法打出的组织图像分类值映射到两类分类标量值0和1。接着连同第二步获得的矢量划分为训练集、验证集和测试集三部分,送入线性回归机器学习方法,搭建NAFLD患者NAFL1、NAFL2和NASH三种亚型分类模型。模型的评价指标包括敏感度、特异性、准确率、AUC值。

四、结果与结论

本文从79名临床诊断为NAFLD的患者身上获得了HE染色标本的数字图像,并由病理学家进行了评估,所提出的方法在对照组和NAFLD组之间的分类准确率和AUC值都高于0.95,如表1所示,分类效果良好。当同时使用0维和1维持续性图像时,在NASH和两个NAFL亚型之间分类的最高AUC值分别为0.984和0.946,如表2所示,分类表现较佳。由此可以看出,利用持续同源性对肝脏活检中的拓扑学特征进行定量测量这种方法,不仅能够从正常人群体中准确诊断出NAFLD患者,并且也能从NAFLD的NAFL1、NAFL2和NASH三种亚型的患者中准确识别NASH患者。

此外,本文提出的这种基于数学算法的方法足够灵活,可用于各种免疫组化和特殊染色模式,包括评估纤维化的特殊染色,如Masson三色染色或网状蛋白染色。以上染色模式获得的图像都能使用本文所提出的拓扑数据分析方法显示气球样变与肝硬化或肝相关死亡之间的关系。

名词解释

1. Matteoni分类:将NAFLD根据组织学特点分为4组,1型:单纯性脂肪变性;2型:脂肪变性合并小叶炎症;3型:脂肪变性合并肝细胞气球样变;4型:3型基础上同时合并Mallory-Denk小体或纤维化。

2. NanoZoomer S360型号数字切片扫描仪:NanoZoomer系列是一系列全玻片扫描仪系列,可以快速扫描载玻片,将其转换为数字数据。NanoZoomer S360是最新的高通量型号,非常适合医院和临床实验室使用。

3. DIPHA算法:一种由Jan Reininghaus发布的分布式的持续同源算法, 在github有2014年的开源代码

https://github.com/DIPHA/dipha。

图1:放大图像聚焦于病理特征。(左图:从NASH组提取,肝细胞本身肿胀并变形为不清晰的圆形,由肝细胞的气球样变导致从白色到灰色的各种颜色渐变。右图:从NAFL2组中提取,脂肪滴显示为白洞,与肝细胞形成高度对比,有脂肪变性,但没有气球样变。)

图2:本研究的拓扑数据分析示意图。包括活检数据采集、持续同源性预处理和机器学习诊断三个步骤

图3:组织图像和持续性图像。(a)CR,(b)NAFL1,(c)NAFL2,(d)NASH。左图为组织图像,中图为0维持续性图像PI0,右图为1维持续性图像PI1

表1:对照组与三个非酒精性脂肪肝组中的每一组的分类性能。准确率计算为(T P + T N)/(T P + F P + T N + F N)。敏感性和特异性分别计算为T P/(T P + F N)和T N/(F P + T N)。TP、FP、TN和FN分别表示真阳性、假阳性、真阴性和假阴性

表2:非酒精性脂肪肝亚型的三组之间的分类性能


Pepper soup transformed by: Geng Shi




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向

深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章