HER2免疫组化的最终检测结果受到检测前、检测中和检测后的多个质控环节的影响,因此,如何在HER2 IHC检测中改进质量管理技术,也是近年来的备受关注的研究热点。在2024 USCAP病理年会上,有多项相关研究成果发布,特别是当肿瘤组织有限时HER2质控也得到了人工智能AI和数字病理的加持(100、235、248、259、264)。其中第259号摘要来自复旦大学附属肿瘤医院于宝华教授团队,探讨了冷缺血时间对浸润性乳腺癌HER2免疫组化表达影响。第264号摘要来自河北医科大学第四医院刘月平教授团队,研究了乳腺癌中四种HER2免疫组化染色方法的相关性研究与异质性模式变化。下面将对以上5篇摘要的具体内容进行介绍。
100. 优化数字病理学中基于人工智能的HER2评分:检测中心的智能滑块机制方法
通过独特且强大的AI模型在不同中心单位通过数字病理学达到HER2切片评分的一致是一项挑战。当将算法结果与不同检测中心的病理学家专家评估结果进行比较时,差异变得明显。这些差异主要是由于检测中心之间的扫描仪和染色差异造成的。我们的研究提出了一种新方法来解决这个问题,而无需重新训练算法。
我们从六个不同单位收集了HER2切片,每个单位都有自己的病理学家所确定的HER2结果。我们将这些单位进行划分,三个为训练组,三个为测试组。首先在训练组上训练我们的算法,然后在测试组上对其进行测试。该算法为每个小的肿瘤区域分配一个概率,表明其属于四个HER2类别之一的可能性,然后以可能性最高的类别作为该区域的类别。然后根据基于HER2染色强度和百分比的临床指南确定每张切片的整体结果。为了纠正在某些检测中心的切片中所观察到的任何高判或低判模式,作者引入了一种滑块机制(a slider mechanism)。这允许向上或向下调整预测的HER2概率,从而细化每个中心的HER2积分算法。值得注意的是,单个滑块值可调整所有对四个HER2类别的预测,因此该方法可以直观地减少算法对总体积分的低判或高判。我们使用四个HER2类别的宏观平均F1积分作为每个中心的表现衡量标准。表1展示了没有采用滑块时算法的基本性能,并与采用滑块调整后的性能进行了比较。结果表明,HER2分类的F1积分随着每个中心的滑块调整而提高。
滑块机制提供了一种实用的方法来调整算法预测能力,以使其更好地与每个中心的趋势相匹配。这种方法有望在数字病理学中实现更一致的HER2分类,减少定期再培训的需要,并提高不同中心之间的一致性。
235.细胞系结合人工智能作为监测HER2 IHC检测重现性的质控工具
人表皮生长因子受体2(HER2)是乳腺癌中一个重要的免疫组化(IHC)指标,用于确定是否可使用HER2靶向治疗,无论是针对经典的HER2过表达还是HER2低表达状态。为了确保IHC检测的可重复性,我们评估了具有相关HER2表达水平的细胞系结合人工智能(AI)是否可以用于识别不准确的HER2 IHC检测。我们纳入了来自5个微阵列的63个乳腺癌样本和一个商品化细胞组织块(Histocyte),其中包含4个具有动态且临床相关的HER2表达的细胞系。HER2 IHC克隆号为PATHWAY 4B5,基因扩增状态通过FISH验证。为了在模拟实际操作中因为不同实验条件所致的HER2表达差异,我们采用了12个具有不同技术敏感性和切片厚度的IHC方案。所有人工IHC评分都是由三名评审员根据2023年ASCO/CAP指南对所有乳腺癌和细胞系商量一致后的结果。细胞系由AI算法评分,提供一个定量的H分数,以确定每个细胞系核心的HER2表达。如果两个或更多细胞系核心在3次重复中的平均H分数与参考值相差不到2个标准差,则结果被评为可接受(图1)。细胞系人工评估HER2结果对于乳腺癌临床关键性改变的预测敏感性:集中关注经典分类的敏感性为85%,相比之下HER2低表达的敏感性为84%。对于HER2经典过表达,BCs中的异常结果与细胞系中可接受的结果都与BCs中的假阴性结果有关。关于HER2低表达,差异与假阴性和假阳性结果都有关系。使用AI对细胞系中的HER2表达水平进行评分,对于HER2经典过表达和HER2-Low,临床上关键变化的敏感性分别提高到95-96%(图2)。
基于这项初步研究,结合细胞系和AI是一个评估HER2 IHC染色可重复性的潜在的、有前途的工具。仍需进一步纳入更多在关键性阈值附近的乳腺癌病例进行更多研究,并结合真实世界的不同免疫组化检测方法和染色程序,以评估这种质控工具的稳定性。248. 从PATHWAY到UPATHWAY:新HER2 4B5检测程序对判读的影响
DESTINYBreast04试验带来了“HER2-低表达”这一新的临床概念:即免疫组化(IHC)评分1+或IHC评分2+且原位杂交(ISH)非扩增的HER2阴性患者。我们还引入了FDA批准的新HER2 4B5抗体方法,这需要重新验证IHC检测程序。在我们的研究中,我们通过两位病理学家对新旧程序的结果进行了比较。所有HER2 IHC病例验证时均应用两种程序。切片去掉标识后,由两名病理学家(P1和P2)对切片进行盲阅;根据ASCO/CAP标准判读肿瘤HER2,并评估良性乳腺组织(BBT)的染色情况。计算加权Cohen kappa统计数据(95%CI)是为了评估1)方案的参与者间可靠性和2)病理学家跨方案的可靠性。共纳入157例病例。对于HER2阴性(0/1+)与2+及3+相比,新程序(κ: 0.84; CI: 0.81, 0.93)和旧程序(κ: 0.84; CI: 0.76, 0.91)的实验者间一致性都非常好。比较新旧程序时,P1和P2的一致性很强(表)。我们在采用旧程序被分类为阴性的肿瘤中观察到最大的变化:分别21.9%(P1)和17.7%(P2)的病例在新方案中被重新分类为2+。将HER2阴性分为0与1+,新程序(κ: 0.80; CI: 0.74, 0.86)和旧程序(κ: 0.84; CI: 0.78, 0.89)的判读者间一致性都非常好。比较新旧程序时,P1和P2的一致性很强(表1)。P1将旧程序里38.1% (24/63)得分0的病例在新程序中重新分类为1+/2+;P2也有同样的情况,占22.4% (17/76)。没有病例从阴性(0/1+)被重新分类为阳性(3+)。根据新程序,9个病例经至少一名病理学家判读后从2+重新分类为3+。临床解读为2+的所有病例,均行ISH检测。其中,6个有扩增,3个为非扩增(均为第4组)。111例有BBT。参与者间一致性为中等到差(新K:0.32;CI:0.17,0.47;旧K:0.45;CI:0.30,0.60)。在比较新旧程序时,两者均注意到染色增加(P1:51.3% vs. 77.4%;P2:28.8% vs. 51.3%)。新旧HER2 4B5程序的评估者间一致性非常好,即使在区分0和1+时也是如此,现在,区分0和1+是有潜在意义的。然而,在新程序中肿瘤和良性乳腺组织的染色均更强,导致高达38%的0分病例被重新分类为1+/2+。这种染色增强效果可能会导致2+病例被错误地分类为3+,特别是当肿瘤组织有限时。
259. 冷缺血时间对浸润性乳腺癌HER2免疫组化表达影响的定量评估
众所周知,福尔马林固定(DFF)的延迟会对乳腺癌生物标志物的准确评估产生不利影响。然而,关于DFF对HER2免疫组化评估影响的定量分析鲜有报道,特别是在HER2低表达的病例中。本研究的目的是进一步分析DFF对浸润性乳腺癌HER2表达的影响。收集我中心36例可触及的浸润性乳腺癌病例。所有患者均未接受新辅助治疗。对于每个病例,将肿瘤分成多个等份,并在室温下进行不同的冷缺血时间(CIT)(0.5、1、2、4、8和24小时)。固定24-48小时后进行HER2免疫组化(克隆号4B5)染色。使用预先训练的人工智能(AI)模型评估浸润性乳腺癌细胞的染色强度和完整性。判读结果由训练有素的病理学家进一步核对。标准评分由0.5h CIT样品的染色结果确定。36例中,11例(30.6%)HER2免疫组化评分降低。在11例HER2 1+病例中,18.18%(2/11)显示最终评分下降一个分级(HER2 1+→HER2 0),其中1例评分的变化从2小时CIT开始,另1例从8小时开始,其余9例HER2 1+病例中,虽然最终的HER2评分没有变化,但膜染色较弱且不完整的浸润性肿瘤细胞的百分比确实有所下降。与0.5h CIT相比,4h CIT时,44.44% (4/9)的病例达到了10%的减少。在CIT 8h时,55.56%(5/9)的病例达到了10%的减少。在HER2 2+病例中,80%(4/5)显示降低一个分级(HER2 2+→HER2 1+)。在HER2 3+病例中,20%(4/20)显示降低一个分级(HER2 3+→HER2 2+)。在其余HER2 3+病例中,虽然最终评分没有改变,但延迟固定确实对HER2染色产生了不利影响。与0.5h CIT相比,4h、8h和24h CIT的强且完整的膜染色模式的百分比有显著的下降趋势(p=0.0477,p=0.0087,p=0.0001)。
DFF对浸润性乳腺癌HER2表达的IHC评估有不利影响。这项研究的结果强调了适当固定的重要性。特别是对于HER2低表达的病例,小幅百分比评分的减少可能会改变患者的最终结局和相关治疗。264. 乳腺癌四种HER2免疫组化染色方法的相关性研究与异质性模式变化
鉴于HER2检测现实的局限性和多样性,需要对HER2检测进行一致性研究。我们比较了乳腺癌四种HER2免疫组化染色方法(4B5、SP2、CB11和EP3)的HER2表达水平,观察不同检测方法的一致性。此外,异质性的存在显著影响乳腺癌的诊断、治疗策略和预后判断。因此,我们还揭示了不同抗体染色模式的异质性及其变化。对202例石蜡包埋的浸润性乳腺癌标本进行HER2免疫组化检测。3名病理学家分别评估了HER2评分和四种检测的异质性模式。一致性结果即为最终结果。HER2的判读标准遵循最新的美国临床肿瘤学会/美国病理学家学院(ASCO/CAP)指南。该研究将异质性定义为>5%但<50%的肿瘤细胞中存在不同的染色强度(例如强、中、弱、微弱和几乎不可察觉)和不完整的HER2膜染色。异质性模式分为集聚型、混合型和分散型。在研究和教育多模式人工智能平台(RE-MAP)中处理和分析数据。202例浸润性乳腺癌中,4B5为0、1+、2+、3+的病例数分别为74例(36.6%)、52例(25.7%)、36例(17.8%)、40例(19.8%)。以4B5为标准,SP3、CB11和EP3的kappa值(准确度)和ICC值(一致性)分别为0.90、0.90和0.89(表1)。对于HER2 IHC 3+、2+和1+,CB11准确度最高,SP3最灵敏(图1)。用不同的检测方法染色后,异质性模式也会发生变化(图1)。将结果分类为HER2阳性、HER2低表达和HER2 0后,我们发现不同检测方法之间具有高度一致性(图2)。
表1. 与4B5相比,不同免疫组化分析的可靠性和一致性参数
图1. 不同检测方法HER2染色结果的变化及异质性模式。A. SP3与4B5染色结果比较,B. CB11与4B5染色结果比较,C. EP3与4B5染色结果比较,D. SP3和4B5异质性模式的变化,E. CB11和4B5异质性模式的变化,F. EP3和4B5异质性模式的变化,G. CB11和EP3异质性模式的变化。四种检测方法之间具有高度一致性。不同检测中HER2评分的变化也会导致异质性模式的变化。(广东省中医院 杨海峰,青岛大学附属医院 王成勤 审校)
陈旭
山东大学齐鲁医院病理科 主治医师
主持国家自然科学基金1项,主持山东省自然科学基金1项。以第一作者在 Journal of Pathology(IF 7.9)、J Exp Clin Cancer Res(IF 10.7)等杂志发表高质量SCI论文多篇。
唐甜
广州医科大学附属第二医院病理科 主治医师,医学硕士
【本文系原创文章,如需转载请标明来源;本订阅号为非盈利性专业学术交流平台,所有文章仅供公益交流,不代表本订阅号立场。热诚欢迎所有关心与支持乳腺病理发展的同仁,加入到我们的订阅号,积极推动我国乳腺病理事业的蓬勃发展,投稿邮箱:breastpathology@163.com】