从传统显微镜下的组织学诊断转变为电脑屏幕上的数字病理诊断,无论是视觉习惯、思维方式还是图像的缩放及导航方法等多方面均需要完成一个系统性的转变和适应。数字病理(digital pathology, DP)系统组建安装完成后,需要通过全面的规范化验证和培训,确认系统运行平稳可靠、病理医师完成数字化阅片训练后方能正式投入应用。但国内DP生态环境尚处于发展培育阶段,大部分病理工作者对DP的验证还不够重视,甚至部分人员对验证的方法和过程还不甚了解,大部分病理医师的数字化阅片训练也不够充分。为此,作者结合国外的相关标准、指南和自己的实践经验对DP临床应用的验证和医师数字化阅片培训进行简要介绍,以便引起更广泛的重视,同时供实施DP的实验室参考。 通常,对于DP应用有三种不同类型的验证目的:学术研究(非临床目的)、临床应用和产品合格性相关的验证研究。学术研究验证是根据各自研究项目本身的需要进行的自我定义研究,常见于经同行评审的出版物文献,重点是关注某一个特定组成部分的验证过程。这种验证属于与科研实验路线和过程相关的实验室内部验证,其结果着眼于研究项目的严谨性,不需要推广和泛化。
产品合格性验证旨在获得监管机构的批准,取得DP产品和与之配套的软件系统的临床应用许可证,例如美国食品药品监督管理局(Food and Drug Administration, FDA)、加拿大卫生局(Health Canada)和欧盟一致性(Conformance European, CE)标志认证等机构要求对申请上市前批准的DP产品的生产参数和预期用途等相关资料必须如实申报。上述相关监管机构对DP设备制造商要求非常严格,需要制造商提供完整的生产过程记录和自我验证材料。这些材料通常由上述相应监管机构组织的病理专家小组等进行充分的论证后做出相应的决定和建议。而且,这些用于申请上市前批准的产品参数和预期用途的验证资料无需对用户公开。临床目的验证是专门对与临床诊疗目的和预期用途相关的数字病理设备、方法和人员能力等进行的专有验证。验证过程记录了特定临床用途的特点、结果及人员培训情况,主要是为了患者的医疗安全,以便为临床应用做好准备。验证的内容包括全切片成像(whole slide imaging, WSI)图像用于临床诊断的准确性、DP设备的可靠性和DP流程的顺畅性。其中对病理医师使用DP工具进行诊断的能力培训和验证至关重要。这些验证必须遵循公认的方法和指南,而非学术研究中使用的自定义方法。基于WSI模式的DP验证,一些相关的专业协会和机构相继提出了各自的要求,也按照相应的医疗规范以遵从患者诊治安全为原则发布了相应的指南,包括一些机构对之前发布的指南更新版本。主要有美国病理学家学会(College of American Pathologists, CAP)等于2021年发布的《用于病理诊断目的的WSI验证:来自于CAP、美国临床病理协会(the American Society for Clinica Pathology, ASCP)和病理信息协会(the Association for Pathology Informatics, API)的更新指南》和英国皇家病理学家学院(the Royal College of Pathologists, RCP)的《实施数字化病理的最佳实践建议》。而在2019年,英国利兹NHS公立教学医院(Leeds Teaching Hospitals NHS Trust)总结了他们在传统病理实验室向DP流程转换升级过程中的经验,发布了自己的《数字化病理初始诊断的培训和验证实用指南》。
2.1 2021年新版CAP、ASCP和API指南的特点2021年新版CAP、ASCP和API指南包含了12条验证建议,其中3条为强烈推荐条款,9条为良好实践声明(good practice statements, GPS)。其主要侧重点在于DP设备本身。首先,该指南设置了WSI与传统显微镜观察者的一致性(同一观察者对同一组织的玻璃切片和WSI图像观察的一致性,即intraobserver agreement)不低于95%的标准。一致性是指同一观察者对同一病例通过玻璃切片光镜观察和WSI两种不同方法观察能够得出的相同结果,理想状态是100%。但这种要求是不现实的,病理诊断具有一定的主观性,即使是玻璃切片的光镜观察,也存在观察者之间和观察者内部的变化和不确定性。验证是一个过程,旨在证明新技术或仪器在应用于患者诊疗之前能够按照预期用途执行。因此,该过程的目的不是评估诊断的正确性或验证特定病理医师的诊断能力。一致性低于95%意味着验证失败,相应的DP工具暂不能应用于患者的病理诊断,参与的病理医师的验证结果低于平均水平(不代表该医师的真实诊断水平),需要继续对WSI图像进行观察学习,以尽快适应新的诊断模式。同时,若在验证过程中出现观察者内一致性低于95%的情况时,要对DP产品和参与验证的病理医师进行核查以便找出可能导致一致性低于95%的系统性问题。这些问题包括:出现诊断不一致的病例及其类型;造成这种不一致的人为因素即评审小组的评价偏倚;以及不一致病例是否与可纠正的组织学和(或)数字化有关。其次,在观察玻璃切片与相应的WSI图像之间需要间隔2周的“记忆洗脱期”,并且要求验证的病例要随机排序。目的是减少验证过程中病理医师对首次观察结果的记忆而造成诊断一致性偏倚。我们的实践显示,“记忆洗脱期”在4~8周之间能够更好地减少记忆偏倚。再次,强调将DP设备作为整体进行验证,不建议对系统中的单独部件(如计算机硬件、监视器、网络、扫描仪)或数字化过程的每个步骤进行单独验证。同时,强调当DP设备中任何组件发生变化时要采取必要的措施保证变化后的系统性能稳定。但是,由于国内和国外的临床环境和制造标准存在巨大差异,该条标准是否适合国内的现状还有待更多的实践验证。美国FDA对于DP产品的审批要求为设备的全部组件和过程,包括计算机硬件、浏览器、网络软件、扫描仪等,并把这些组件作为一个整体进行验证审核。而国内除对扫描仪和自带软件有规范要求外,对计算机硬件、显示器以及网络无任何规范要求,因此建议在当前的国内DP环境中对相关产品的每个部件进行单独验证。
2.2 RCP和英国利兹NHS公立教学医院的DP临床验证指南2018年RCP制定发布了《实施数字化病理的最佳实践建议》,以下简称“最佳实践建议”。该最佳实践建议强调了DP应用的全过程验证和病理医师应用WSI的学习考核过程,并给出了相应的建议和针对亚专科医师培训的具体验证实例。RCP最佳实践建议关于DP应用流程的验证有以下特点:(1)除对整体DP系统进行校验外,RCP的验证覆盖了DP应用的全流程。强调了WSI图像使用过程中存在的风险及防范措施。其基本理念和方法来自英国利兹NHS公立教学医院的DP临床应用实践,临床实用性较好,类似的验证方法也被欧洲其他国家如瑞典等借鉴。(2)最佳实践建议强调了对病理医师的培训过程和对病理医师使用WSI能力的重视。采用WSI病例训练集的回顾性学习使病理医师初步熟悉并习惯于DP全流程环境下的工作方式,而后续的前瞻性实时病例WSI诊断训练则使病理医师全面了解了DP诊断中存在的陷阱和局限性,从而增强了病理医师使用WSI诊断的信心,并保证了DP诊断的安全性。而且,我们也发现病理医师在使用WSI进行诊断时,确实存在随着学习或实践时间增加而诊断一致性不断提高的过程。(3)实时病例WSI诊断的验证学习方法不拘泥于固定的病例数,而是由病理医师按照自己的特点和节奏灵活掌握学习的进度和亚专科方向,通过一段时间的实战练习,从而达到自己的目标。这既增强了病理医师在训练过程中的针对性,也满足了不同领域亚专科病理医师的重点需求。最后,在病理医师完成验证学习并达到熟练应用DP工具的预期目标后,后续工作中的持续监督和总结反馈作为DP应用的质量保证措施被加以强调,也是RCP这版最佳实践建议的鲜明特点。
对于DP设备来说,只有各项功能达到预设的基本指标并正常运行,才能保证WSI图像的产出质量和观察效果;对于DP流程,只有按照正常标准实施和执行(从常规玻璃切片制作开始)以及对各环节有效把控,才能保证最后的诊断质量。国内DP应用起步晚,在引进时又缺乏规范,DP的临床验证工作始终是一个薄弱环节,与国际上成熟应用DP的地区相比差距巨大。主要体现在:首先是认识不足,重视程度不够,甚至一些使用DP工具的医师对验证和认证的区分不熟悉;其次是很多以远程会诊应用为主的中小实验室,其设备和流程未经过验证,出现问题后不知所措,其结果则是大大降低了DP工具的使用效果;再次是少数实验室即使形式上存在验证,但验证内容简单,验证方法单一或者不当,其结果是无法全面了解DP流程中的一些技术问题;最后,病理医师缺乏使用DP工具进行临床病理诊断的系统培训,从而导致DP诊断质量和时间效率的下降,这一点与RCP最佳实践建议的要求相去甚远。大多数病理医师对DP的全面应用相对生疏、缺乏应有的实践经验和风险防范意识。表面上看,WSI图像诊断并不难,也不易出错,其实这只是国内以远程会诊为主的低通量小负荷工作造成的假象,加之平时所谓相对容易的标本(如胃肠镜活检、子宫颈内膜活检及阑尾胆囊等)尚未充分暴露出WSI中隐藏的风险。例如,电脑屏幕高倍视场与传统光镜高倍视野观察范围的不同 (这里高倍指40倍)将影响那些依据以高倍视野为单位计数核分裂象或Ki67增殖指数完成诊断的病例,如乳腺癌的分级、孤立性纤维性肿瘤、胃肠间质瘤以及消化系统神经内分泌肿瘤等的恶性风险程度评估等等。这些问题均需要对DP设备进行严格的测试、校验和验证才能解决。因此,一定要意识到WSI图像诊断的陷阱和风险,加强DP的实践学习,重视DP的规范化验证考核过程。
DP系统由硬件(扫描仪、显示器和网络连接)、信息集成管理系统和WSI图像浏览器组成。无论是2021年新版CAP、ASCP和API指南,还是RCP最佳实践建议,均将DP设备作为一个整体进行验证,其主要目的就是保证整个系统运行的完整性和稳定性。另外,更重要的原因是经FDA批准或取得欧盟CE认证的DP产品是将扫描仪、显示器及相关的管理和查看软件作为一个整体设备审批的,在上市前批准审查中对组成整套设备的单个组件均进行了严格的参数校准和质量核验。因此,对于欧美国家制造商生产的DP产品只进行整体验证是可行的。近几年,国产扫描仪制造取得了长足的进步,少数头部企业的高端扫描仪在装载容量、扫描速度及稳定性上与国外同类产品相比差距不大。但是,不可否认,一些企业的大多数产品仍以低通量及手工操作为主,配套软件的功能相对简单,工艺水平参差不齐。再加上显示器的配置比较随意,基本上都是消费者现货级的普通版本,各种参数尤其是分辨率只能满足一般的常规应用,对要求较高的WSI观察很难达到预期目的。甚至个别产品还存在扫描参数标注与实际不符的现象,如用10mm×10mm的扫描面积代替标准扫描面积(15mm×15mm)进行标注以显示自家产品的速度优势等。所以,对国产的低端DP设备,仅仅作为一个整体来验证是不够的,不仅要进行配套验证,更重要的是还需对各个组件进行严格的核验,对提供的各种参数进行细致检查和校验。
3.2 结合病理实验室的实际情况选择合适的验证方法一般来说,DP的临床验证方法主要有WSI与玻璃切片的诊断一致性验证、DP方法与光镜诊断方法的非劣效性验证及实时诊断病例的前瞻性验证。每个病理实验室的情况不同,对DP应用的要求和范围也不尽相同。虽然国内目前DP的主要应用方向为远程病理,但现在的远程病理应用也早已不局限于远程会诊,一些医疗机构特别是第三方医学实验室,远程初始诊断和术中冷冻病理检查已经成为日常工作中的主要检查类型。一些大型学术医疗中心引入DP的目的,短期内以科研、学术及教学为主,同时也在为实施DP全流程转换升级做准备。因此,至于选择哪种方法进行验证,要根据各自病理实验室的条件和DP应用的目标范围等做出恰当选择。DP作为一种全新的病理诊断工具,大多数病理医师的实际应用经验还很欠缺。对于DP应用的全过程验证,完成DP系统的校验只是验证工作的开始,更重要的是验证病理医师对WSI图像的正确认知和使用,包括WSI给诊断带来的好处,与显微镜诊断有什么不同,存在哪些不足甚至是诊断陷阱,在使用中如何避免等等,以便病理医师在使用DP工具时达到与光镜观察同样的效果。所以,DP临床验证的核心问题是验证病理医师使用WSI正确诊断的能力,因而也是病理医师自我学习和提高的过程。这也是上述RCP最佳实践建议里的核心内涵,即“验证应该被视为一种持续的学习和质量保证活动,而不仅仅是寻求验证数据的证据”。同样,2021年新版CAP、ASCP和API验证指南中增加的DP方法与光镜诊断一致性不低于95%的标准,也包含了病理医师对DP持续学习、不断提高的要求。随着对图像处理技术的不断突破和实时高速高通量全切片扫描仪的不断迭代,实现日常病理工作的全面数字化不再是遥不可及,而且,国外成功运行的全数字化病理科(complete digital pathology, CDP)的质控和验证过程已成为ISO15189认证指南的内容。未来一段时间内,国内DP发展的主要任务应该聚焦于:(1)全面推进CDP建设;(2)基于数字切片的人工智能辅助诊断工具的验证和应用研究。而这些工作均是建立在DP流程正确和病理医师熟练掌握数字工具应用的基础之上,所以,必须重视和加强DP的临床验证工作,确保DP工具正确高效使用。为此,笔者建议尽快制定DP临床验证指南或专家共识,以指导和规范DP验证工作;对使用DP工具的病理工作者进行规范系统的DP相关内容的培训,重点是使用数字切片进行日常病理诊断的训练。
来源:临床与实验病理学杂志,2024,40(10):1018-1020DOI:10.13315/j.cnki.cjcep.2024.10.003投稿请认准官方网站:http://www.cjcep.com
网站首页:
电 话:0551-65161102
邮 箱:cjcepgzh@163.com 点击下方“阅读原文”直接进入官网