原来病理组学的质控是这么做的,这篇NC解决了这个问题

文摘   2024-12-18 10:31   北京  

为方便大家学习和资料管理,后续资料将通过另一个平台进行发放和汇总


GrandQC:数字病理领域质控问题的全面解决方案

随着病理学数字化的推进,GrandQC工具的诞生标志着质量控制(Quality Control, QC)技术的一次重大飞跃。该工具专为数字病理学中的组织切片质控问题设计,凭借其高精度的组织分割和多类型伪影检测功能,填补了现有工具的多项技术空白。

质控的挑战与GrandQC的开发

数字病理学的转型中,组织切片数字化必然面临多种伪影问题,例如气泡、滑片边缘模糊、焦点外区域、笔记痕迹等。这些伪影不仅影响下游图像分析算法的性能,还可能导致肿瘤检测中的假阳性或假阴性结果,带来严重的临床风险。

GrandQC应运而生,提供了两个核心模块:组织检测多类别伪影检测。其算法基于深度学习的像素级语义分割技术,利用手动精确标注的大规模多机构数据集进行训练,支持对整片组织的全面质控。

精确且高效的质控流程

GrandQC的质控流程包括以下几大步骤:

  1. 数据准备与算法训练

  • 训练数据集涵盖208张用于组织检测和420张用于伪影检测的全切片图像,来源于多个国际病理机构,广泛涵盖不同的器官和标本类型。

  • 手动标注伪影类别,包括气泡、滑片边缘、暗点、异物和组织褶皱等,同时生成了用于焦点外区域(OOF)的合成数据。

  • 算法采用EfficientNetB0作为编码器,并结合UNet++进行解码。

  • 组织检测模块验证

    • 在测试数据集中,组织检测的Dice得分高达0.957,尤其在小颗粒组织检测和质量较差切片的检测中表现卓越。

    • 真实场景验证包括来自五个不同机构的600张H&E染色切片,平均评分为9.44分(满分10分),体现了几乎理想的检测能力。

  • 伪影检测模块验证

    • 针对不同放大倍率(5x、7x、10x)的版本进行了优化,伪影检测精度(Dice得分)在0.919到0.938之间。

    • 实验表明,即使在复杂的真实切片中,GrandQC也能精确检测并区分多类别伪影。

  • 性能评估与运行效率

    • GrandQC在普通GPU设备(如NVIDIA RTX 3090)上运行,每张切片的组织检测耗时小于1秒,伪影检测耗时在1分钟以内。

    • 该工具具备高并行化潜力,可在高负载场景中实现快速分析。

    应用场景与优势

    GrandQC的核心优势在于其多样化的应用场景:

    • 临床与科研的质控基准:可以用于评估不同病理机构或扫描系统的切片质量。

    • 下游算法性能提升:在肺癌和结直肠癌的肿瘤分割任务中,GrandQC通过伪影检测和屏蔽,显著提高了算法的准确性和敏感性。

    • 单细胞检测防伪影干扰:在结直肠癌单细胞分类任务中,GrandQC有效防止了因伪影导致的错误细胞分类。

    展望与开放资源

    作为一款开源工具,GrandQC不仅提供了训练模型和代码,还开放了TCGA数据集中所有的质控掩膜。这为研究人员在无监督学习和弱监督学习中去除伪影影响提供了宝贵资源。

    总之,GrandQC不仅是一项技术突破,更是一种推动数字病理学迈向更高精度、更高效率的创新工具。它的应用将为病理学诊断和研究带来深远影响,为临床精准医疗的实现铺平道路。

    Weng, Z., Seper, A., Pryalukhin, A. et al. GrandQC: A comprehensive solution to quality control problem in digital pathology. Nat Commun 15, 10685 (2024).

    生信钱同学
    北京大学在读博士生,记录自己的学习日常🌞分享生信知识:如单细胞和空间测序、多组学分析、宏基因组、病理组学、影像组学等生物信息学、机器学习和深度学习内容🌬
     最新文章