蒋惠珊,高野,林寒,等.人工智能食管细胞学风险预测模型在食管癌前病变中的构建和验证[J].中华消化内镜杂志, 2024, 41(10): 762-767.
Jiang Huishan, Gao Ye, Lin Han, Xin Lei, Wang Wei, Li Zhaoshen, Wang Luowei.Development and validation of an artificial intelligence‑assisted esophageal cytological risk prediction model for detecting esophageal precancerous lesions[J].Chin J Dig Endosc,2024, 41(10): 762-767.
DOI: 10.3760/cma.j.cn321463-20240904-00378.
蒋惠珊 高野 林寒 辛磊 王伟 李兆申 王洛伟
海军军医大学第一附属医院消化内科
通信作者:王洛伟,Email:wangluoweimd@126.com
食管癌是消化系统常见恶性肿瘤,根据2022年全球癌症登记数据显示,其死亡率在所有恶性肿瘤中居第7位。与西方国家腺癌为主的情况不同,食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)是我国食管癌的主要病理学类型,占病例总数的90%以上。由于ESCC发病隐匿,早期缺乏特异性临床表现,多数患者在确诊时已发展至中晚期,治疗后五年生存率仍不足30%。因此,亟需在无症状的食管癌高危人群中开展筛查,以期在早期癌和癌前病变阶段检出病变。目前,上消化道内镜技术是食管癌前病变筛查的主要方法。传统及新型血液标志物对食管癌前病变筛查的灵敏度仍相对较低(26.7%~68.4%),在人群筛查中应用有较大局限性。在前期研究中,本团队基于新型食管细胞采集及人工智能检测技术建立食管癌筛查新方法,开展了一项全国性、多队列、前瞻性食管癌筛查试验(esophageal cancer screening trial,EAST),结果显示EAST筛查食管癌灵敏度、特异度分别可达94.5%和91.9%。食管癌前病变的筛查和管理是降低食管癌发病率的关键,也是非内镜筛查方法的瓶颈,前期研究尚未对食管癌前病变进行针对性分析与准确性评价。因此,本研究基于EAST研究数据开展二次分析,旨在利用人工智能食管细胞学构建食管癌前病变的风险预测模型,并验证其诊断准确性。
一、受试者资料
EAST由海军军医大学第一附属医院牵头,主要在我国食管癌高发区开展,高发区定义为2016年年龄标化发病率高于15/10万的地区。筛查的开展形式主要包括医院机会性筛查和基于社区的组织性筛查,为了使研究纳入的人群更加具有代表性,本研究开展的场景包括二、三级医院和社区卫生服务中心。
1.医院机会性筛查场景:参与研究的医院分布于我国9个省17个城市的24家三级医院和15家二级医院,参与研究医院的护士在各自医院的门诊或内镜检查登记处对预约上消化道内镜检查的连续受检者进行纳入排除标准核对与入组邀请。纳入2021年1月1日至2022年6月30日期间计划接受上消化道内镜筛查的40~75岁受试者,包括因为消化道症状前来就诊的人群和单纯来体检做胃镜的健康人群。排除标准:存在吞咽困难、呕血和黑便症状;在前一年内已接受过上消化道内镜检查;有食管肿瘤或癌症病史;既往患有食管胃静脉曲张或食管狭窄;有食管或胃手术史;存在凝血障碍或正在服用抗凝剂或抗血小板药物。
2.社区筛查场景:2021年1月1日至2022年6月30日期间,社区工作人员通过发送短信的方式招募江苏省食管癌高风险地区中5个社区(南京市栖霞区龙潭街道龙潭社区、南京市栖霞区尧化街道金尧花园社区、南京市玄武区新街口街道成贤街社区、南京市栖霞区马群街道芝嘉花园社区和泰州市高港区口岸街道田河社区)40~75岁的受试者。居民收到短信后,可前往指定的社区卫生服务中心。社区卫生服务中心的工作人员详细说明筛查的具体内容、流程,以及可能的风险与收益。排除标准与医院机会性筛查人群相同。经过详细的研究内容告知与解释,符合条件并同意参与的居民正式纳入研究。
为进一步排除对特异度计算的影响,本二次分析中对内镜下确诊的食管癌予以剔除。本研究方案已获得海军军医大学第一附属医院伦理委员会的批准(批准号:2020⁃088),并经过39家医疗机构的审查或备案。
二、研究流程
研究详细实施流程参见EAST研究已发表论文,简要流程如下。
1.受试者宏观危险因素调查:受试者均完成结构化的线上问卷调查,调查内容包括人口学信息和风险因素暴露情况,如性别、年龄、体重指数、居住地、教育水平、吸烟和饮酒习惯、饮食习惯、牙齿脱落情况、消化系统疾病家族史以及个人病史。
2.食管细胞采集与样本监测:由经过培训的护士在门诊、内镜中心或社区诊所的研究专区内使用我国批准应用的新型食管细胞富集器(Esoheal1.0TM)完成细胞采样(已完成国家Ⅰ类医疗器械备案,备案号:苏泰械备20190073)。吞咽后,装填于胶囊外壳内的细胞富集材料在略低于贲门处膨胀成穹顶三叶状,在牵拉提线缓慢取出的同时富集食管和胃食管结合部细胞。细胞富集器在取出后放入固定液中保存,运送到海军军医大学第一附属医院消化内科实验室进行统一样本处理和质控。细胞学样本质控标准定义:样本总细胞计数>300万个。如细胞学样本质控不合格,则在上消化道内镜检查前对受试者进行第2次采样,如第2次采样样本判定为合格,则纳入分析;如第2次样本仍不合格,则将该名受试者排除。
3.上消化道内镜与活检病理学
(1)训练集流程:我国食管癌高发地区的39个三级或二级医院人群构成医院机会性筛查队列,设定为训练集。受试者在细胞学检查后10 d内接受上消化道内镜检查。内镜检查采用卢戈染色内镜、窄带光成像或蓝激光成像对食管全长和胃食管结合部进行详细检查,每个可疑病变区域至少取1块活检样本。内镜医师对受试者的人工智能食管细胞学风险预测评分不知情。活检样本送至参与研究的医院病理科,由两名具有10年以上阅片经验病理医师进行独立评估。
模型的构建基于轻量梯度提升机(light⁃gradient boosting machine,LightGBM)算法,整合流行病学因素和细胞学参数训练而成(简称LightGBM模型)。每例受试者样本制作30张液基细胞学切片,经染色、数字扫描后由海军军医大学第一附属医院消化内科实验室的研究员提取数字化图像和细胞学相关参数。每张切片提取包括细胞形态学特征、染色强度、细胞分布模式等参数。这些参数与受试者的流行病学数据相结合,作为LightGBM算法的输入特征。LightGBM模型的输出概率定义为风险预测评分。风险预测评分用于后续的受试者工作特征(receiver operator characteristic,ROC)曲线分析及cutoff值的确定。此外,为了提高模型的预测能力和稳定性,对特征进行了标准化处理,确保不同特征的量纲一致。
(2)验证集流程:江苏省5个社区人群构成社区筛查队列,设定为验证集。受试者在细胞学筛查后10 d内接受上消化道内镜检查,内镜医师对受试者的人工智能细胞学检查结果不知情。内镜检查方法和活检样本的诊断流程与训练集相同。
三、主要结局
研究主要结局指标为食管癌前病变的检出率。其余评价指标包括ROC曲线下面积(area under the curve,AUC)、灵敏度、特异度、阳性预测值、阴性预测值和准确率。以内镜检查的活检组织病理学结果为金标准。
四、统计学方法
统计学结果使用R软件(x64 version 3.6.3)进行分析。正态分布的计量资料以±s表示,2组间的比较行t检验;非正态分布的计量资料以M(Q1,Q3) 表示,2组间比较行Mann⁃WhitneyU检验。计数资料以例(%)表示,采用卡方检验或Fisher确切概率法。P<0.05为差异有统计学意义。
在机会性筛查队列中训练LightGBM模型,采用最大化Youden指数确定最佳cutoff值,并在社区筛查队列中评估其诊断效能。采用Wilson法计算灵敏度、特异度、阳性预测值和阴性预测值的置信区间,采用DeLong法计算AUC置信区间。
本研究参考了Riley等发表的预测模型的样本量估算方法:假设研究人群中预测目标的患病率为2%,模型预测参数预估为100个,收缩系数为0.90,表观的优化预期为0.05,计算得出所需样本量为9 908例。
1.研究人群基线特征:2021年1月1日至2022年6月30日,二、三级医院机会性筛查人群共15 365例受试者接受问卷信息调查和细胞学采样,剔除不合格病例(见图1A),最终纳入14 415例受试者。社区筛查人群共3 206例受试者接受问卷与细胞学采样,剔除不合格病例(见图1B),最终纳入2 879例受试者。研究人群基线资料见表1。
图1 人工智能食管细胞学筛查的受试者纳入与研究实施流程图 1A:医院机会性筛查人群的纳入与研究实施;1B:社区筛查人群的纳入与研究实施
表1 食管癌医院机会性筛查队列和社区筛查队列的人群基线特征比较
特征 | 医院机会性筛查队列 | 社区筛查队列 | 统计量 | P值 |
例数 | 14 415 | 2 879 | ||
年龄[岁, M(Q1,Q3)] | 55(50,63) | 54(49,61) | U=1 658 | <0.001 |
性别[例(%)] | χ2=44.13 | <0.001 | ||
男 | 6 779(47.0) | 1 549(53.8) | ||
女 | 7 636(53.0) | 1 330(46.2) | ||
居住地[例(%)] | χ2=509.39 | <0.001 | ||
城市 | 11 329(78.5) | 2 777(96.5) | ||
农村 | 3 086(21.5) | 102(3.5) | ||
吸烟[例(%)] | χ2=360.99 | <0.001 | ||
是 | 2 626(18.3) | 978(34.0) | ||
否 | 11 789(81.7) | 1 901(66.0) | ||
饮酒[例(%)] | χ2=222.22 | <0.001 | ||
是 | 3 471(24.0) | 1 079(37.5) | ||
否 | 10 944(76.0) | 1 800(62.5) | ||
饮酒后脸红[例(%)] | χ2=8.49 | 0.004 | ||
是 | 354(2.4) | 45(1.6) | ||
否 | 14 061(97.5) | 2 834(98.4) | ||
热烫饮食习惯[例(%)] | χ2=1 100 | <0.001 | ||
是 | 6 712(46.5) | 397(13.8) | ||
否 | 7 703(53.4) | 2 482(86.2) | ||
进食腌制食品习惯[例(%)] | χ2=424.11 | <0.001 | ||
是 | 2 390(16.5) | 149(5.2) | ||
否 | 12 025(83.4) | 2 730(94.8) | ||
缺齿个数[例(%)] | χ2=2.01 | 0.570 | ||
无 | 7 695(53.3) | 1 500(52.1) | ||
1~4个 | 4 881(33.8) | 998(34.7) | ||
5~12个 | 1 313(9.1) | 278(9.7) | ||
>12个 | 526(3.6) | 103(3.5) | ||
食管癌家族史[例(%)] | χ2=293.27 | <0.001 | ||
是 | 1 804(12.5) | 49(1.7) | ||
否 | 12 611(78.4) | 2 830(98.3) |
2.癌前病变检出:根据最终的活检组织病理学结果,医院机会性筛查队列共检出癌前病变188例(1.3%),其中高级别上皮内瘤变病例69例(0.5%),低级别上皮内瘤变病例119例(0.8%);社区筛查队列共检出癌前病变21例(0.7%),高级别上皮内瘤变14例(0.5%),低级别上皮内瘤变7例(0.2%)。
3.LightGBM模型的构建:在机会性筛查队列中,LightGBM模型在机会性筛查队列中预测癌前病变的ROC曲线下面积为0.93(95%CI:0.91~0.95)。最大约登指数时,LightGBM模型的风险预测评分为0.08,将该分值确定为cutoff值。以风险预测评分>0.08判定为癌前病变作为诊断标准,此时LightGBM模型筛查癌前病变的灵敏度和特异度分别为91.0%(95%CI:86.9%~95.1%)和86.2%(95%CI:85.7%~86.8%),阳性预测值和阴性预测值分别为8.0%(95%CI:6.9%~9.2%)和99.9%(95%CI:99.8%~100.0%)。
4.LightGBM模型的诊断效能验证:在社区筛查队列中,以风险预测评分>0.08判定为癌前病变作为诊断标准,LightGBM模型筛查癌前病变的灵敏度和特异度分别为95.2%(20/21)和87.5%(2 502/2 858),阳性预测值和阴性预测值分别为5.3%(20/376)和100.0%(2 502/2 503),准确率为87.6%(2 522/2 879),其AUC为0.95(95%CI:0.89~1.00)(图2)。
图2 不同筛查队列中LightGBM模型诊断食管癌前病变的受试者工作特征曲线
食管癌对国民健康构成了沉重负担,特别是对高发地区居民。本团队前期牵头开展了EAST研究,已基于人群筛查数据,创新性地构建整合数字化细胞图像与宏观风险因素的机器学习食管癌风险预测模型。该模型在社区筛查场景中展现出良好的验证效果,然而,对于ESCC至关重要的癌前病变阶段的针对性分析尚未开展。为填补这一研究空白,本研究对前期医院机会性筛查及社区筛查数据进行了二次分析,聚焦于ESCC的癌前病变阶段(包含高级别上皮内瘤变与低级别上皮内瘤变),旨在分析人工智能在食管癌前病变诊断、筛查中的效能。
对于癌前病变,LightGBM模型展现了极高的灵敏度和特异度。根据本研究结果,在机会性筛查队列中,LightGBM模型对癌前病变的灵敏度达91.0%,特异度为86.2%;在社区筛查队列中,LightGBM模型对癌前病变的灵敏度达95.2%,特异度为87.5%。然而,尽管特异度较高,本模型较高的假阳性率不可忽视。造成假阳性率较高的原因可能是模型过于敏感,倾向于优先发现潜在病变个体。为解决这一问题,未来的研究还可以通过引入多模态数据(如影像、基因、传统临床数据)进一步优化模型性能。LightGBM模型在食管癌前病变中的成功应用不仅可以提高早期诊断的精度,还能降低依赖传统内镜检查的频率。在食管癌高发地区,内镜筛查资源相对有限,通过LightGBM模型进行筛查能够有效识别出高风险个体,从而优化内镜检查资源的利用。此外,食管癌前病变是从非典型增生向早期ESCC发展的关键节点,早期发现并干预可以显著减少食管癌的发病率,因此,人工智能的高灵敏度为食管癌前病变患者争取了宝贵的治疗窗口。
相比之下,虽然血液标志物的实施更简单,且患者接受度更高,但在癌前病变阶段其灵敏度较低,在早期癌的发现中难以发挥有效作用。细胞学筛查通过直接获取食管黏膜样本,能够更早地发现病变,其灵敏度显著高于血液标志物筛查,这是其最大的优势。
人工智能在食管细胞学筛查中的应用前景广阔,但医务人员培训、标本的保存与运输等需进一步优化。此外,还需加强科普教育,提高患者对人工智能在食管细胞学筛查的认知和接受度,以提升筛查依从性。在社区筛查中,优化筛查路径,使人工智能技术更有效地应用于高危人群的早期发现和干预。通过应对这些挑战,有望进一步提高食管癌筛查的精准度和效率,降低ESCC的发病率与死亡率,为减轻我国乃至全球的食管癌疾病负担贡献力量。
蒋惠珊:数据整理、统计分析、论文撰写;高野:论文设计、研究指导、论文修改;林寒、辛磊、王伟、李兆申、王洛伟:研究指导、经费支持
参考文献略
来源:中华消化内镜杂志
收稿日期 :2024-09-04
编辑:钱程 校对:朱悦 审核:唐涌进