人工智能与HER2免疫组化检测质控—2024 USCAP 乳腺癌专场最新报道系列

文摘   健康   2024-08-01 08:01   四川  

引言

HER2免疫组化的最终检测结果受到检测前、检测中和检测后的多个质控环节的影响,因此,如何在HER2 IHC检测中改进质量管理技术,也是近年来的备受关注的研究热点。在2024 USCAP病理年会上,有多项相关研究成果发布,特别是当肿瘤组织有限时HER2质控也得到了人工智能AI和数字病理的加持(100、235、248、259、264)。其中第259号摘要来自复旦大学附属肿瘤医院于宝华教授团队,探讨了冷缺血时间对浸润性乳腺癌HER2免疫组化表达影响。第264号摘要来自河北医科大学第四医院刘月平教授团队研究了乳腺癌中四种HER2免疫组化染色方法的相关性研究与异质性模式变化。下面将对以上5篇摘要的具体内容进行介绍。

100. 优化数字病理学中基于人工智能的HER2评分:检测中心的智能滑块机制方法


 背景 

通过独特且强大的AI模型在不同中心单位通过数字病理学达到HER2切片评分的一致是一项挑战。当将算法结果与不同检测中心的病理学家专家评估结果进行比较时,差异变得明显。这些差异主要是由于检测中心之间的扫描仪和染色差异造成的。我们的研究提出了一种新方法来解决这个问题,而无需重新训练算法。

 设计 

我们从六个不同单位收集了HER2切片,每个单位都有自己的病理学家所确定的HER2结果。我们将这些单位进行划分,三个为训练组,三个为测试组。首先在训练组上训练我们的算法,然后在测试组上对其进行测试。该算法为每个小的肿瘤区域分配一个概率,表明其属于四个HER2类别之一的可能性,然后以可能性最高的类别作为该区域的类别。然后根据基于HER2染色强度和百分比的临床指南确定每张切片的整体结果。为了纠正在某些检测中心的切片中所观察到的任何高判或低判模式,作者引入了一种滑块机制(a slider mechanism)。这允许向上或向下调整预测的HER2概率,从而细化每个中心的HER2积分算法。值得注意的是,单个滑块值可调整所有对四个HER2类别的预测,因此该方法可以直观地减少算法对总体积分的低判或高判。

 结果 

我们使用四个HER2类别的宏观平均F1积分作为每个中心的表现衡量标准。表1展示了没有采用滑块时算法的基本性能,并与采用滑块调整后的性能进行了比较。结果表明,HER2分类的F1积分随着每个中心的滑块调整而提高。


 结论 

滑块机制提供了一种实用的方法来调整算法预测能力,以使其更好地与每个中心的趋势相匹配。这种方法有望在数字病理学中实现更一致的HER2分类,减少定期再培训的需要,并提高不同中心之间的一致性。

235.细胞系结合人工智能作为监测HER2 IHC检测重现性的质控工具


 背景 

人表皮生长因子受体2(HER2)是乳腺癌中一个重要的免疫组化(IHC)指标,用于确定是否可使用HER2靶向治疗,无论是针对经典的HER2过表达还是HER2低表达状态。为了确保IHC检测的可重复性,我们评估了具有相关HER2表达水平的细胞系结合人工智能(AI)是否可以用于识别不准确的HER2 IHC检测。

 设计 

我们纳入了来自5个微阵列的63个乳腺癌样本和一个商品化细胞组织块(Histocyte),其中包含4个具有动态且临床相关的HER2表达的细胞系。HER2 IHC克隆号为PATHWAY 4B5,基因扩增状态通过FISH验证。为了在模拟实际操作中因为不同实验条件所致的HER2表达差异,我们采用了12个具有不同技术敏感性和切片厚度的IHC方案。所有人工IHC评分都是由三名评审员根据2023年ASCO/CAP指南对所有乳腺癌和细胞系商量一致后的结果。细胞系由AI算法评分,提供一个定量的H分数,以确定每个细胞系核心的HER2表达。如果两个或更多细胞系核心在3次重复中的平均H分数与参考值相差不到2个标准差,则结果被评为可接受(图1)。

 结果 

细胞系人工评估HER2结果对于乳腺癌临床关键性改变的预测敏感性:集中关注经典分类的敏感性为85%,相比之下HER2低表达的敏感性为84%。对于HER2经典过表达,BCs中的异常结果与细胞系中可接受的结果都与BCs中的假阴性结果有关。关于HER2低表达,差异与假阴性和假阳性结果都有关系。使用AI对细胞系中的HER2表达水平进行评分,对于HER2经典过表达和HER2-Low,临床上关键变化的敏感性分别提高到95-96%(图2)。


 结论 

基于这项初步研究,结合细胞系和AI是一个评估HER2 IHC染色可重复性的潜在的、有前途的工具。仍需进一步纳入更多在关键性阈值附近的乳腺癌病例进行更多研究,并结合真实世界的不同免疫组化检测方法和染色程序,以评估这种质控工具的稳定性。

248. 从PATHWAY到UPATHWAY:新HER2 4B5检测程序对判读的影响


 背景 

DESTINYBreast04试验带来了“HER2-低表达”这一新的临床概念:即免疫组化(IHC)评分1+或IHC评分2+且原位杂交(ISH)非扩增的HER2阴性患者。我们还引入了FDA批准的新HER2 4B5抗体方法,这需要重新验证IHC检测程序。在我们的研究中,我们通过两位病理学家对新旧程序的结果进行了比较。

 设计 

所有HER2 IHC病例验证时均应用两种程序。切片去掉标识后,由两名病理学家(P1和P2)对切片进行盲阅;根据ASCO/CAP标准判读肿瘤HER2,并评估良性乳腺组织(BBT)的染色情况。计算加权Cohen kappa统计数据(95%CI)是为了评估1)方案的参与者间可靠性和2)病理学家跨方案的可靠性。

 结果 

共纳入157例病例。对于HER2阴性(0/1+)与2+及3+相比,新程序(κ: 0.84; CI: 0.81, 0.93)和旧程序(κ: 0.84; CI: 0.76, 0.91)的实验者间一致性都非常好。比较新旧程序时,P1和P2的一致性很强(表)。我们在采用旧程序被分类为阴性的肿瘤中观察到最大的变化:分别21.9%(P1)和17.7%(P2)的病例在新方案中被重新分类为2+。将HER2阴性分为0与1+,新程序(κ: 0.80; CI: 0.74, 0.86)和旧程序(κ: 0.84; CI: 0.78, 0.89)的判读者间一致性都非常好。比较新旧程序时,P1和P2的一致性很强(表1)。P1将旧程序里38.1% (24/63)得分0的病例在新程序中重新分类为1+/2+;P2也有同样的情况,占22.4% (17/76)。没有病例从阴性(0/1+)被重新分类为阳性(3+)。根据新程序,9个病例经至少一名病理学家判读后从2+重新分类为3+。临床解读为2+的所有病例,均行ISH检测。其中,6个有扩增,3个为非扩增(均为第4组)。111例有BBT。参与者间一致性为中等到差(新K:0.32;CI:0.17,0.47;旧K:0.45;CI:0.30,0.60)。在比较新旧程序时,两者均注意到染色增加(P1:51.3% vs. 77.4%;P2:28.8% vs. 51.3%)。


 结论 

新旧HER2 4B5程序的评估者间一致性非常好,即使在区分0和1+时也是如此,现在,区分0和1+是有潜在意义的。然而,在新程序中肿瘤和良性乳腺组织的染色均更强,导致高达38%的0分病例被重新分类为1+/2+。这种染色增强效果可能会导致2+病例被错误地分类为3+,特别是当肿瘤组织有限时。

259. 冷缺血时间对浸润性乳腺癌HER2免疫组化表达影响的定量评估


 背景 

众所周知,福尔马林固定(DFF)的延迟会对乳腺癌生物标志物的准确评估产生不利影响。然而,关于DFF对HER2免疫组化评估影响的定量分析鲜有报道,特别是在HER2低表达的病例中。本研究的目的是进一步分析DFF对浸润性乳腺癌HER2表达的影响。

 设计 

收集我中心36例可触及的浸润性乳腺癌病例。所有患者均未接受新辅助治疗。对于每个病例,将肿瘤分成多个等份,并在室温下进行不同的冷缺血时间(CIT)(0.5、1、2、4、8和24小时)。固定24-48小时后进行HER2免疫组化(克隆号4B5)染色。使用预先训练的人工智能(AI)模型评估浸润性乳腺癌细胞的染色强度和完整性。判读结果由训练有素的病理学家进一步核对。

 结果 

标准评分由0.5h CIT样品的染色结果确定。36例中,11例(30.6%)HER2免疫组化评分降低。在11例HER2 1+病例中,18.18%(2/11)显示最终评分下降一个分级(HER2 1+→HER2 0),其中1例评分的变化从2小时CIT开始,另1例从8小时开始,其余9例HER2 1+病例中,虽然最终的HER2评分没有变化,但膜染色较弱且不完整的浸润性肿瘤细胞的百分比确实有所下降。与0.5h CIT相比,4h CIT时,44.44% (4/9)的病例达到了10%的减少。在CIT 8h时,55.56%(5/9)的病例达到了10%的减少。在HER2 2+病例中,80%(4/5)显示降低一个分级(HER2 2+→HER2 1+)。在HER2 3+病例中,20%(4/20)显示降低一个分级(HER2 3+→HER2 2+)。在其余HER2 3+病例中,虽然最终评分没有改变,但延迟固定确实对HER2染色产生了不利影响。与0.5h CIT相比,4h、8h和24h CIT的强且完整的膜染色模式的百分比有显著的下降趋势(p=0.0477,p=0.0087,p=0.0001)。


 结论 

DFF对浸润性乳腺癌HER2表达的IHC评估有不利影响。这项研究的结果强调了适当固定的重要性。特别是对于HER2低表达的病例,小幅百分比评分的减少可能会改变患者的最终结局和相关治疗。

264. 乳腺癌四种HER2免疫组化染色方法的相关性研究与异质性模式变化


 背景 

鉴于HER2检测现实的局限性和多样性,需要对HER2检测进行一致性研究。我们比较了乳腺癌四种HER2免疫组化染色方法(4B5、SP2、CB11和EP3)的HER2表达水平,观察不同检测方法的一致性。此外,异质性的存在显著影响乳腺癌的诊断、治疗策略和预后判断。因此,我们还揭示了不同抗体染色模式的异质性及其变化。

 设计 

对202例石蜡包埋的浸润性乳腺癌标本进行HER2免疫组化检测。3名病理学家分别评估了HER2评分和四种检测的异质性模式。一致性结果即为最终结果。HER2的判读标准遵循最新的美国临床肿瘤学会/美国病理学家学院(ASCO/CAP)指南。该研究将异质性定义为>5%但<50%的肿瘤细胞中存在不同的染色强度(例如强、中、弱、微弱和几乎不可察觉)和不完整的HER2膜染色。异质性模式分为集聚型、混合型和分散型。在研究和教育多模式人工智能平台(RE-MAP)中处理和分析数据。

 结果 

202例浸润性乳腺癌中,4B5为0、1+、2+、3+的病例数分别为74例(36.6%)、52例(25.7%)、36例(17.8%)、40例(19.8%)。以4B5为标准,SP3、CB11和EP3的kappa值(准确度)和ICC值(一致性)分别为0.90、0.90和0.89(表1)。对于HER2 IHC 3+、2+和1+,CB11准确度最高,SP3最灵敏(图1)。用不同的检测方法染色后,异质性模式也会发生变化(图1)。将结果分类为HER2阳性、HER2低表达和HER2 0后,我们发现不同检测方法之间具有高度一致性(图2)。

表1. 与4B5相比,不同免疫组化分析的可靠性和一致性参数

1. 不同检测方法HER2染色结果的变化及异质性模式。A. SP34B5染色结果比较,B. CB114B5染色结果比较,C. EP34B5染色结果比较,D. SP34B5异质性模式的变化,E. CB114B5异质性模式的变化,F. EP34B5异质性模式的变化,G. CB11EP3异质性模式的变化。

2. 不同检测方法的HER2临床分类结果

 结论 

四种检测方法之间具有高度一致性。不同检测中HER2评分的变化也会导致异质性模式的变化。
广东省中医院 杨海峰,青岛大学附属医院 王成勤 审校

作者简介




陈旭

山东大学齐鲁医院病理科  主治医师 

山东省医学会病理学分会乳腺学组 委员兼秘书
山东省医师协会肿瘤免疫治疗医师分会 委员
济南市抗癌协会肿瘤病理专业委员会委员
主持国家自然科学基金1项,主持山东省自然科学基金1项。
以第一作者在 Journal of Pathology(IF 7.9)、J Exp Clin Cancer Res(IF 10.7)等杂志发表高质量SCI论文多篇。



周娜
医师,医学硕士 广东省中医院病理科 

亚专科方向:乳腺病理




唐甜

广州医科大学附属第二医院病理科  主治医师,医学硕士 

亚专科方向:乳腺病理
广东省病理医师分会青年委员会 委员
广州市医师协会乳腺病学分会 委员
END



【本文系原创文章,如需转载请标明来源;本订阅号为非盈利性专业学术交流平台,所有文章仅供公益交流,不代表本订阅号立场。热诚欢迎所有关心与支持乳腺病理发展的同仁,加入到我们的订阅号,积极推动我国乳腺病理事业的蓬勃发展,投稿邮箱:breastpathology@163.com】

乳腺病理
乳腺病理精彩病例和微课堂分享、优秀文献及重要会议推送,病理医师沟通学习交流平台。
 最新文章