气球状肝细胞特征识别的复杂性:为基于人工智能的非酒精性脂肪肝成像定义训练图谱

文摘   其他   2024-07-16 00:02   江苏  

深度学习辣汤小组文献阅读学习之五十四

气球状肝细胞特征识别的复杂性:为基于人工智能的非酒精性脂肪肝成像定义训练图谱

DeepLearning 深度学习辣汤小组

 2022/9/20 


来自圣路易斯华盛顿大学医学院病理和免疫学系的Elizabeth M教授及团队使用九名国际公认病理学家标记的气球样变肝细胞图谱,评估了观察者间一致性,并根据一致性结果,同时训练一种对气球样肝细胞进行量化的算法,并在Journal of Hepatology(IF:30.083)期刊上发表题为“Complexity of ballooned hepatocyte feature recognition: Defining a training atlas for artificial intelligence-based imaging in NAFLD”的文章。

DOI:

https://doi.org/10.1016/j.jhep.2022.01.011


一、研究背景

非酒精性脂肪性肝病(NAFLD,Nonalcoholic fatty liver disease)包括肝脏损伤的病理谱,其特征是在没有过量饮酒的情况下肝细胞内,脂肪的过量积聚。NAFLD的进展包括脂肪变性(非酒精性脂肪肝,NAFL,Nonalcoholic Fatty Liver)、脂肪性肝炎(非酒精性脂肪性肝炎,NASH,Nonalcoholic Steatohepatitis)、纤维化和肝硬化。迄今为止,NAFLD非常普遍,给全球医疗资源带来了巨大的负担,并且,预计在未来十年病人数将进一步增加。

虽然NASH的活动性级别有可能会随着时间的推移而增减,但它被认为是纤维化的潜在高危因素,而纤维化反过来决定长期结果。目前,肝活检的组织学评估是诊断NASH、分级活动性和评估纤维化阶段的基础,组织学评估的肝细胞气球样变是区分NASH和脂肪变性NAFL的关键特征。可靠的评估气球样变的存在与否,是将患者纳入临床试验,并作为药物疗效的关键监管批准替代终点。据文献报道,使用目前已经提出了两种半定量评分系统NASH-CRN和SAF来辅助病理学家对NASH的分级和分期,存在观察者间/观察者内气球样变识别差异大的问题,并且没有提出可行的解决方案。

因此,迫切需要对区分NAFLD和NASH的重要组织病理学特征,特别是肝细胞气球样变的存在和量化,进行可重复、客观和标准化的评估。随着人工智能算法的发展和应用,可以开发一套基于人工智能的辅助算法实现该功能,目前还没有研究通过对高分辨率数字化图像的评估和注释来具体解决单个细胞水平的气球样变,因此本文旨在利用来自九位国际公认的肝病理学专家的盲法独立评估,生成可靠且可重复识别的气球样肝细胞的数据集,并且该数据集可用于支持检测和量化肝细胞气球样变的机器学习算法的开发。同时进行一项重点研究,准确评估观察者间肝细胞气球样特征识别的差异。

二、数据集

九位具有丰富经验的资深的国际公认的病理学家参与此项研究。

本研究利用了来自两项随机对照试验(CymaBay Therapeutics,Inc .的Seladelpar试验[NCT03551522])和Madrigal Pharmaceuticals,Inc .的Resmetirom试验[NCT02912260])的10个肝活检样本。该训练集的活检组织涵盖了无气球样变到存在显著气球样变和中度纤维化的NAFLD等级/阶段。并从Resmetirom期NASH试验中选择22例配对活检病例作为qBallooning2算法的独立“测试”队列。

所有的数字化图像都使用Aperio数字病理学成像系统(徕卡生物系统公司)获得H&E染色的肝组织切片。

三、方法

实验流程如图1所示,研究的数据采集分两个阶段进行,病理学家们独立执行任务,并且在研究结束之前不知道小组的结果。在第一阶段, 病理学家被要求在数字活检载玻片图像中圈出所有的气球状肝细胞,并且知道注释将被用于评估观察者之间对气球状细胞识别的一致性。在第二阶段,间隔3个月之后,相同的载玻片以不同的顺序重新呈现给病理学家,其中一些图像旋转90度或镜像。病理学家未被告知这些图像与之前评估的图像相同,或者发生了旋转或镜像。病理学家被要求按照第一阶段相同的标准圈出气球样肝细胞并且给出是否NASH的诊断。

病理学家第一阶段在10个H&E载玻片上标注的气球样肝细胞被记录下来,并用于在相应的SHG/TPEF图像上为人工智能算法生成训练集的标准,使用传统的图像分析方法,确定了TPEF通道上气球状肝细胞的合适候选物。总共45个鼓胀参数被建立和量化。从45个特征的总体数据集中,基于7个参数(6个气球状细胞参数:单位组织面积的气球状肝细胞的总周长、气球状肝细胞和最近的气球状肝细胞之间的距离变化、气球状肝细胞和最近的气球状肝细胞之间的平均距离、气球状肝细胞的100微米内的气球状肝细胞的平均数量、气球状肝细胞的100微米内的气球状肝细胞的数量变化;和1胶原参数:每单位组织面积的气球状肝细胞周围的总胶原面积。)建立“qBallooning2”算法。qBallooning2算法的性能可以根据提供用于训练它的一致性的病理学家的数量来进一步调整。 该团队系统地使用了所有可能的训练集,如图2,最终使用≥5名病理学家的一致性优化的qBallooning2算法被选为进一步研究的样本算法。

最后,考虑到气球样肝细胞的数量是一个连续变量,对绝对一致性和一致性的单测量组内相关系数(ICC,Intraclass Correlation Coefficient)(名解1)进行了测试。并根据每位病理学家报告的每张图像中气球样肝细胞的数量,转化为三点半定量鼓胀评分(SQBS,Semi-Quantitative Ballooning Score) ,使用成对线性加权kappa(名解2)统计来计算病理学家之间SQB的一致性,通过Wilcoxon秩和检验(名解3)计算qBallooning2连续值的变化差异。

四、结果与结论

针对三个目标条件(1.存在任何肝细胞气球样变;2.存在至少5个气球状肝细胞;3.半定量膨胀评分(SQBS)的一致性。)进行评估观察者一致性,结果如图3,被确定为气球状的肝细胞数量在观察者之间存在显著差异。Fleiss kappa统计值仅为0.197,ICC为0.640,病理学家之间的成对比较中,识别相同特定细胞为气球样细胞的一致性水平差异很大。

NASH诊断一致性的kappa值仅为0.127,表明独立手术时病理学家之间对NASH的诊断差异显著。如图4所示,只有一幅图像,所有病理学家都诊断为NASH。

结合图3和图4,不难发现只有两位病理学家确定存在气球样变与NASH的诊断之间存在显著的正相关(病理学家D和G)。在当前的监管框架下,可能过于强调确定临床试验中给定活检标本中是否存在气球样肝细胞。

qBallooning2算法可以被不同地校准以用于诊断或用于检测临床相关的时间变化(比如使用≥5名病理学家的一致性训练的qBallooning2算法,识别出88个气球样肝细胞,其中22个同时被病理学家选中,阳性预测值达到25%,在证明该算法具备可行性的前提下,其预测结果也有待进一步优化),人工智能方法的应用提供了一种潜在的辅助技术,可以补充人类病理学,用于肝细胞气球样变的存在和量化,进行可重复、客观和标准化的评估。

名词解释

1. ICC:组内相关系数,它是衡量和评价观察者间信度和复测信度的信度系数指标之一。它最先由Bartko于1966年用于测量和评价信度的大小。ICC等于个体的变异度除以总的变异度,其值介于0~1之间。0表示不可信,1表示完全可信。一般认为信度系数低于0.4表示信度较差,大于0.75表示信度良好。

2. kappa:一致性检验,即内部一致性系数,是作为评价判断的一致性程度的重要指标,取值在0-1之间。Kappa大于等于0.75两者一致性较好,kappa小于0.75大于等于0.4两者一致性一般,kappa小于0.4两者一致性较差。

3. Wilcoxon秩和检验:非参数检验,用于检验两个“独立样本”是否来自同一分布,不要求被检验的 2 组数据包含相同个数的元素,换句话说,秩和检验更适用于“非成对数据”之间的差异性检测。秩和检验用于推断计量资料或等级资料的两个独立样本所来自的两个总体分布位置是否有差别。这是一种非参数替代配对双样本t检验,其可以被用于比较样品的两个独立的组。当数据不是正态分布且经过一定的数值转换尝试后,仍然无法满足正态性要求时使用,它将两独立样本组的非正态样本值进行比较。

图1:实验流程图

图2:qBallooning2算法参数调整结果图

图3:病理学家气球样肝细胞识别差异对比

图4:病理学家NASH诊断差异对比

Pepper soup transformed by: Yang Na




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向


深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章