ESMO 2024丨肺癌诊断新突破:十项前沿研究引领肿瘤诊断工具革新(下篇)

2024-09-30 18:38   中国  
*本资料仅供医疗卫生专业人士参考,请勿向非医疗卫生专业人士发放。

2024年欧洲肿瘤内科学会年会(ESMO 2024)已圆满闭幕,会议发布了众多的研究仍等待梳理与探寻。本篇聚焦肺癌诊断技术的最新发展,纳入五篇研究摘要,涵盖了从人工智能(AI)辅助诊断到生物标志物检测的诊疗应用,以期为患者带来更早的干预机会和更好的预后结果。

1. 基于贝叶斯(Bayesian)深度学习与马尔可夫链蒙特卡洛(MCMC)方法的肺癌分期预测与预后信息学研究

当前,肺癌研究的核心领域涵盖了先进的放射学成像技术,尤其是胸部X射线与计算机断层扫描(CT)的广泛应用。针对肺癌早期检测的重要性,多个具有里程碑意义的临床试验,如NLST、NELSON及英国UKLS研究,已明确指出了筛查项目在高危人群中的关键作用。特别地,低剂量计算机断层扫描(LDCT)以其卓越的敏感性在早期肺癌检测中展现出了显著优势。然而,尽管成效显著,当前仍缺乏一个统一且稳健的筛查策略框架。在此背景下,AI作为一种新兴且强有力的辅助工具,逐渐在医学领域崭露头角,特别是在提升肺部恶性肿瘤早期检测精准度方面展现出了巨大潜力。

本研究旨在开发一种基于贝叶斯深度学习的神经网络模型,专门应用于肺癌检测。该模型集成了Hamiltonian Monte Carlo(HMC)技术,以确保对模型参数空间的高效且精确探索,从而增强了模型的可信度与有效性。实验结果表明,该模型达到了99%的准确率。

本研究不仅在技术上超越了传统方法,还为AI在医学诊断领域的应用树立了新的标杆,为未来的癌症早期与精准检测研究指明了方向。尤为重要的是,本研究首次明确展示了贝叶斯神经网络(BNNs)在医学应用中的显著优势。BNNs不仅能够提供高精度的预测结果,还能量化预测的不确定性,为肺癌诊断带来了革命性的变化。特别是在本实验中,BNN模型所展现出的99%高准确率,进一步凸显了其作为高效诊断工具的巨大潜力。

此外,本研究还探索了深度神经网络(DNN)在肺癌分期预测中的应用,该模型在预测任务中表现出色,准确率高达93%。DNN模型的多层架构能够有效捕捉数据中的复杂模式,这是其实现高性能预测的关键所在。这些发现不仅深化了我们对AI在医学诊断中作用的理解,也为未来肺癌诊断技术的发展提供了宝贵的参考。

2. 优化肺癌筛查策略:基于AI/ML的计算机辅助检测与表征软件的独立验证研究

在肺癌筛查(LCS)流程中,肺结节的检测与风险分层过程繁琐且易出错,常伴随假阳性与漏检现象。相较于人类阅片者,AI技术在肺结节检测及风险预测方面展现出显著优势,超越了现有的风险预测模型(如Brock与MAYO模型)。本研究旨在通过一项独立验证研究,评估该AI/ML驱动的计算机辅助检测与表征软件在外部数据集上的实际应用性能。

研究模型的训练集包含来自NLST(国家肺筛查试验)和LIDC(肺图像数据库联盟)队列的10,872例患者数据,其中543例被确诊为肺癌。为验证模型效能,我们收集了一个符合USPSTF标准(年龄介于50至80岁之间,有吸烟史)的外部验证集,共264例患者,分别来自欧盟(占比26%)和美国(占比74%)。该验证集中包含88例恶性结节与176例良性结节,结节平均大小为6.2×3.2 mm,其中恶性结节的平均尺寸显著大于良性结节,为17.5×5.8 mm。

为确保验证结果的准确性,本研究由两名经验丰富的放射科医师独立标注每例患者的结节情况,并由第三名资深医师作为仲裁者,基于组织病理学结果或12个月随访的稳定性,对结节位置与性质进行最终确认。验证结果显示,该AI软件在风险预测方面的AUC值为0.95,约登指数计算得出的敏感性为93.2%,特异性为87.5%。在癌症检测方面,其灵敏度达到91.2%,同时平均每次扫描产生0.44个假阳性结果。进一步分析表明,该软件的性能在不同技术与临床参数下保持一致,包括但不限于CT制造商、扫描核硬度、层厚、患者性别、数据来源以及结节实性特征(详见表)。

本研究结论指出,与NLST测试集上的表现(AUC:0.97)相比,该AI软件在外部数据集上同样展现出优异的性能,并且在不同亚组中具有高度的鲁棒性。这一发现预示着AI驱动的精准筛查策略有望显著提升LCS的效率,通过减少不必要的检查、降低医疗成本及减轻放射科医师的工作负担,为肺癌的早期发现与治疗带来积极影响。

3. 伦理视角下的肺癌筛查策略选择:4ITLR标准与USPSTF 2021及HUNT肺癌风险模型的比较

在探讨肺癌筛查的伦理选择时,必须审慎考虑不同筛选标准对高危人群的覆盖程度及其潜在影响。挪威一项基于大规模前瞻性人群的研究,旨在对比欧洲4 In the Long Run (4ITLR) 标准、2021年美国预防服务工作组(USPSTF)标准以及HUNT肺癌风险模型(HUNT LCM)的效能与伦理适宜性。

传统的高危人群界定标准,如基于高吸烟包年和年龄的固定阈值,可能无意中排除了大量实际高风险个体,从而引发伦理上的担忧。例如,NLST标准遗漏了最终确诊肺癌的74%人群(Pinsky & Berg, 2012, J Med Screen; Markaki et al., 2018, EBioMedicine),而NELSON标准在挪威则排除了62.6%的肺癌患者(Nguyen et al., 2024, JTO Clin Res Rep)。鉴于此,本研究聚焦于4ITLR标准与USPSTF 2021标准及HUNT LCM之间的比较。

具体而言,4ITLR标准设定为年龄60-80岁,吸烟史≥40包年,且当前吸烟或戒烟未超过10年。而USPSTF 2021标准则要求年龄50-80岁,吸烟史>20包年,且当前吸烟或戒烟未超过15年。这些标准连同HUNT LCM,在挪威一项包含44,831例24-94岁吸烟者、平均随访12.5年的前瞻性人群研究中进行了测试(CONOR研究)。

研究期间,共确诊222例肺癌。应用4ITLR标准筛选出了占总人群1.8%(796/44831)的受试者,并成功预测了14.86%(33/222)的肺癌病例。相比之下,当选取与4ITLR筛选人数相等的HUNT LCM受试者时,预测的肺癌敏感性提升至19.4%(43/222)。而USPSTF 2021标准则覆盖了11.9%(5327/44831)的人群,预测了59.46%(132/222)的肺癌病例;若以相同数量的HUNT LCM受试者进行比较,预测的肺癌敏感性更是高达66.7%(148/222),差异具有统计学意义(P=0.0253)。

值得注意的是,4ITLR标准虽旨在精准定位高危人群,却可能遗漏了85.3%的未来肺癌患者,这引发了对其伦理合理性的质疑。相比之下,采用HUNT LCM或USPSTF 2021标准等风险模型,能够覆盖更多潜在病例(如66.7%的肺癌患者),从而显著提高肺癌的诊断率,可能更符合伦理原则与公共卫生需求。

4. 基于AI算法以精准检测胸片肺结节

鉴于深度学习与卷积神经网络(CNN)在医学成像领域的广泛应用,我们致力于开发一种创新的AI系统,旨在辅助肺癌的早期检测。该系统旨在赋能医生,通过高效解析X光片,提升诊断的准确性和效率。

在算法训练阶段,我们精心构建了一个多元化的数据集,其中包括福岛卫生防腐服务协会提供的800张X线胸片(400张正常,400张异常,专注于肺癌筛查)以及美国国立卫生研究院(NIH)数据库中的5000张胸部X光片。为评估模型性能,我们将数据集划分为A、B两组:A组整合了全部800张胸片与NIH数据库,而B组则仅包含800张胸片。随后,基于ImageNet的预训练模型,我们运用深度学习与CNN技术,开发了一套专有AI算法,并系统评估了其在X光片解读中的统计准确性。

为增强结果的可视化效果,我们引入了热图技术,直观展示每张胸片上的异常阴影区域,并配套以0.0至1.0范围内的阳性概率评分,作为评估肺癌风险的量化指标。此外,我们还通过技术手段补偿了不同放射设备及成像环境间的差异,进一步提升了AI系统的泛化能力。

在评估阶段,设定正概率截断值为0.5时,我们的AI系统在A组数据集上展现出AUC值为0.74,灵敏度达0.75,特异性为0.60;而在B组上,AUC提升至0.79,灵敏度与特异性分别为0.72与0.74。这些指标均优于一般放射科医生的平均水平(AUC 0.72),且与过往研究报告中的结果(AUC 0.67-0.78)相媲美。值得注意的是,训练数据量的增加并未显著影响模型的准确性。在实际应用中,当胸片存在异常阴影时,热图技术能清晰地在显示器上标注出来。

本研究初步验证了该专有AI系统在胸部X线片解读中的高精度,其性能与现有研究及放射科医生水平相当。然而,为确保算法的可靠性与鲁棒性,仍需进一步深入验证与优化。目前,我们正积极开展多种形式的验证工作,以期推动该技术在临床实践中的广泛应用。

5. 新型深度学习模型在肺癌诊断中的验证与应用研究

肺癌作为全球范围内癌症相关死亡的首要原因,同时也是波兰的第二大致死病因,其高致死率主要归因于诊断的延迟与预后效果的不佳。随着深度学习(DL)技术的飞速发展,医学影像分析在肺癌的早期诊断及后续治疗规划中的重要性日益凸显,为改善这一现状提供了重要契机。本研究旨在开发并验证一种基于深度学习的模型,该模型利用WSI进行高效的肺癌检测,以辅助波兰病理学家提升诊断效率与准确性。

本研究的方法论创新点在于结合了卷积神经网络(CNNs)与可分离卷积神经网络(Separable CNNs)的优势,通过优化网络结构显著提升了分类性能。实验结果表明,该模型在极短时间内(小于10秒)即能实现对癌性与非癌性肺细胞图像的精准区分,准确率从96%提升至98%,同时展现出良好的鲁棒性。

进一步地,我们将该模型的诊断性能与活跃在临床一线的病理学家进行了对比验证。结果显示,模型的总体准确率达到了100%,显著高于病理学家的平均准确率(79%)。此外,我们还观察到病理医师的准确率与其工作年限之间存在显著的线性正相关关系(Pearson相关系数r=0.71,95%置信区间为0.14-0.93,P=0.022),这表明经验积累对病理诊断的准确性具有积极影响。

综上所述,本研究提出的深度学习模型在肺癌检测中展现出了卓越的性能,其准确率超越了经验丰富的病理学家。这一发现不仅验证了AI算法在辅助病理学诊断中的巨大潜力,还预示着未来通过结合AI与病理学家的专业知识,有望进一步提升癌症诊断的精准度,缩短诊断周期,为患者争取更宝贵的治疗时间。



*本文不构成任何诊疗相关意见和建议,

仅供医疗人员参考学习

如发现文内有误请联系我们

扫码查看申明

编辑:Joey
审校:Rainsy Ding

排版:Joey



POCKETIN

ESMO 2024


▼更多精彩内容,请长按二维码▼

1. 相关学术信息由医望自主研发的人工智能学术跟踪机器人提供。
2. 相关学术信息由医望提供的医学翻译机器人完成翻译后邀请临床医师进行再次校对。

3. 如有内容上的不准确请微信联系我们(WeChat: TIANNA-AI999)

4. 2023年8月起,POCKETIN引入人工智能(ChatGPT、文心一言),专业编辑携手AI编辑开启会议速递新体验。

POCKET ONC
AI机器人检索并发布肿瘤学领域全球最新学术进展
 最新文章