卵巢癌是女性常见的恶性肿瘤之一,其早期症状不明显,导致许多患者在确诊时已处于晚期,治疗难度大,预后不佳。因此,早期准确检测卵巢癌对于提高患者的生存率和生活质量至关重要。近年来,随着人工智能(AI)技术的迅猛发展,AI在医学影像诊断领域的应用逐渐受到关注。最近发表在《自然·医学》杂志上的一项国际多中心研究,为我们展示了AI在卵巢癌超声检测中的巨大潜力。
研究背景与挑战
卵巢肿瘤的管理依赖于其恶性风险的评估和患者的症状表现。对于看似良性病变的患者,通常采取保守治疗,如超声随访或在症状明显时进行微创手术,以保留生育能力、减少不必要费用和降低发病率。然而,对于疑似卵巢癌的患者,及时转诊至妇科肿瘤专家至关重要,因为专业的手术技术可以显著提高患者的生存机会。
目前,经阴道超声检查是区分良性和恶性卵巢病变的主要技术,因其广泛的可用性和在经验丰富的检查者手中具有较高的诊断准确性。但问题在于,诊断准确性和观察者间一致性在经验不足的检查者中显著降低,可能导致癌症诊断的延误和错误,以及不必要的治疗。此外,活检是禁忌的,因为它可能导致恶性肿瘤扩散,恶化预后。遗憾的是,即使在高收入国家,也严重缺乏专业的超声检查者,导致诊断的延误和漏诊,给医疗系统带来了沉重负担。
AI技术的介入与优势
AI驱动的诊断支持系统为解决这一难题提供了新的思路。研究表明,具有卷积神经网络(CNN)架构的神经网络在卵巢病变分类中显示出有希望的结果。然而,医学AI研究的一个常见陷阱是,在使用回顾性数据时,训练和评估模型的数据来自相同分布,即数据在内容和特征上是同质的。这在临床实践中很少见,因为临床环境高度可变,患者人群、成像设备和采集协议等因素在不同中心之间可能存在显著差异。这种数据集的局限性可能导致所谓的“领域偏移”,即模型在临床环境中遇到的数据与其训练数据不同,从而影响模型的性能。
为了解决这一问题,研究人员采用了大规模的多中心研究来验证模型的泛化能力。在这项名为卵巢肿瘤机器学习合作-回顾性研究(OMLC-RS)的国际多中心回顾性研究中,研究人员评估了神经网络在超声图像中区分良性和恶性卵巢肿瘤的能力。研究使用了来自8个国家20个中心的17,119张超声图像,涵盖了3,652名患者,这些图像使用了来自9家制造商的21种不同的超声系统获取。研究人员采用了基于变换器的模型架构,这种架构在医学成像任务中已被证明是CNN的有力替代品。
研究方法与结果
研究人员采用了留一中心法交叉验证方案,即每次迭代时,将一个中心的病例作为测试集,而模型则使用其他中心的病例进行训练。通过这种方式,研究人员训练了19个基于变换器的神经网络模型,并收集了66名人类检查者(包括33名专家和33名非专家)的51,179次评估,以建立有意义的比较基准。
结果显示,AI模型在所有评估指标上均显著优于人类专家和非专家检查者。AI模型的F1分数为83.50%,而专家和非专家检查者的F1分数分别为79.50%和74.10%。AI模型的假阴性率和假阳性率分别比专家检查者低14.14%和26.74%,与专家和非专家检查者之间的差异相似。此外,AI模型在不同中心、超声系统、组织学诊断、检查者信心水平、患者年龄组和检查年份等亚组分析中均表现出色,显示出良好的鲁棒性。
AI辅助分诊策略的模拟与评估
为了进一步评估AI模型在临床实践中的潜在应用,研究人员模拟了将AI辅助分诊策略整合到常规临床实践中的效果。在当前的临床分诊常规中,非专家检查者会进行初步评估,对于诊断不确定或疑似恶性的病例,会转诊给专家进行进一步评估。研究人员提出的AI辅助分诊策略是将AI模型作为第二位读者,与人类检查者(专家或非专家)一起进行初步评估,然后在意见不一致的情况下由专家检查者做出最终决定。
模拟结果表明,AI模型作为第二位读者,显著提高了非专家检查者的诊断性能(F1分数从77.16%提高到82.70%),同时减少了对专家的转诊需求,从当前实践的1.52次减少到1.19次,降低了63%的转诊率。对于专家检查者,AI模型作为第二位读者也提高了F1分数,从79.50%提高到83.56%,同时仅略微增加了人力资源需求,从1.00次增加到1.15次。
研究意义与未来展望
这项研究首次系统地探索和验证了AI模型在多个国际外部中心中区分良性和恶性卵巢病变的潜力,并与人类检查者进行了比较。研究结果表明,基于变换器的神经网络模型具有强大的泛化能力,能够显著优于所有专家和非专家检查者。此外,AI驱动的分诊策略在提高诊断准确性的同时,大幅减少了对专家的需求,这对于解决专家检查者短缺的问题具有重要意义。
尽管这项研究取得了令人鼓舞的结果,但仍存在一些局限性,如研究的回顾性设计、人类检查者仅基于超声图像进行评估等。未来的研究需要进一步验证AI模型在前瞻性临床实施研究中的表现,并探索其对检查者管理决策的影响。此外,还需要在不同临床环境中评估AI模型的性能,以确保其在实际应用中的可靠性和有效性。
总之,这项研究为AI在卵巢癌检测中的应用提供了有力的证据,展示了AI技术在提高诊断准确性和效率方面的巨大潜力。随着技术的不断发展和临床验证的深入,我们有理由相信,AI辅助诊断将在未来的医疗实践中发挥越来越重要的作用,为患者带来更好的预后和生活质量.