202409综述|结肠镜检查前肠道准备失败风险预测模型的研究现状与进展

健康   2024-10-23 07:32   江苏  



【提要】

结肠镜检查是肠道疾病,特别是结直肠癌早期诊断及治疗的主要手段。早期识别并预防结肠镜检查前的肠道准备失败是完成高质量结肠镜检查的前提和关键。建立肠道准备失败风险预测模型有助于医护人员在结肠镜检查前根据危险分层早期识别出肠道准备失败高风险患者,为制定个性化肠道准备方案和及时采取补救措施提供科学依据,同时更有利于医疗资源合理分配。本文围绕国内外肠道准备失败风险预测模型的相关研究进展进行归纳和总结,以期为今后我国肠道准备失败预测模型的构建及应用研究提供参考和理论依据。


引用本文:



王同昌,贺子轩,范轩鸣,等.结肠镜检查前肠道准备失败风险预测模型的研究现状与进展[J].中华消化内镜杂志, 2024, 41(9): 741-745. 

Wang Tongchang, He Zixuan, Fan Xuanming, Li Zhaoshen, Bai Yu.Current status and progress of research in risk prediction models for colonoscopic bowel preparation failure[J].Chin J Dig Endosc, 2024, 41(9): 741-745. 

DOI: 10.3760/cma.j.cn321463-20231118-00178.

点击下载PDF原文







·综述·
结肠镜检查前肠道准备失败风险预测模型的研究现状与进展

王同昌1 贺子轩2 范轩鸣1 李兆申1,2 柏愚1,2

1海军军医大学第一附属医院消化内科;2国家消化系统疾病临床医学研究中心

王同昌和贺子轩对本文有同等贡献

通信作者:柏愚,Email:md.baiyu@foxmail.com










结直肠癌是全球第3大常见癌症类型及第2大癌症相关死亡原因。结肠镜检查是目前公认的结直肠癌筛查金标准,可以有效降低结直肠癌的发病率、提高治愈率,但其准确性、安全性却很大程度上取决于结肠镜检查前的肠道准备质量。结肠镜检查前肠道准备失败可使操作难度增加、检查时间延长、息肉及腺瘤检出率降低,进而导致重复检查及病变漏诊。因此,早期识别并预防肠道准备失败尤为重要,建立肠道准备失败风险预测模型有助于医护人员预先识别出肠道准备失败高风险者并采取针对性干预措施。本文就近年来国内外肠道准备失败预测模型的研究现状及进展进行了总结。

一、国外的结肠镜检查前肠道准备失败风险预测模型

1.Hassan风险预测模型

2012年意大利学者Hassan等在纳入2 811例患者的多中心研究中,率先采用多因素logistic回归方法,最终确定了男性、高龄、超重、结直肠手术史、肝硬化、帕金森病、糖尿病及粪便隐血试验阳性是肠道准备失败的独立危险因素,在此基础上开发的肠道准备失败预测模型的敏感度、特异度、阳性预测值、阴性预测值和受试者工作特征曲线的曲线下面积(area under the curve,AUC)分别为60%、59%、41%、76%和0.63。该模型首次将多个简单临床变量结合,为预测肠道准备失败提供了新思路,但预测价值较低,且未使用经过可信度及有效性验证的肠道准备质量评价量表,而是使用自行设计的肠道准备质量评价工具,因此影响模型的临床预测价值及推广。

2.Dik风险评分预测模型

2015年荷兰学者Dik等在纳入1 996例患者的多中心研究中,采用多因素logistic回归分析建立了结肠镜检查前肠道准备失败风险预测模型,纳入了美国麻醉医师协会(American Society of Anesthesiologists,ASA)健康状态分级系统评分≥3分、服用三环类抗抑郁药、服用阿片类药物、糖尿病、便秘、腹盆腔手术史、住院、肠道准备失败史作为预测因子,同时制定了总分0~12分的风险预测评分表,分值越高则肠道准备失败风险越大。该模型受试者工作特征曲线的AUC为0.72,敏感度为66.0%,特异度为79.0%,预测价值中等。该风险预测模型评估数据容易获取,评分过程简单,易于临床实践中开展应用。2020年国内崔乃玲等证实应用Dik肠道准备失败预测模型可以显著提高肠道准备的质量。该模型的不足在于所纳患者临床资料为回顾性,且该模型当时未能在新的队列中进一步验证,可能影响了模型的科学性和临床应用价值。

3.Gimeno⁃García风险评分预测模型

2017年西班牙学者Gimeno⁃García等对1 076例下午行结肠镜检查的病例进行分析,采用多因素logistic回归分析筛选出抗抑郁药应用、并发症、便秘和腹盆腔手术史4个独立影响因子,开发出评分系统以识别肠准备不足的高风险患者。该模型更为简化,受试者工作特征曲线的AUC为0.72,当截断值>1.225分时,敏感度为60.3%、特异度为75.4%、阳性预测值为36.4%、阴性预测值为89.1%。该风险评分模型以更少的变量达到了前述研究类似的预测水平,适合门诊患者,针对性强,预测准确性高。但该预测模型也存在肠道准备方案不统一等不足,而且作为一项单中心研究,构建样本量较少且未行外部验证,模型临床应用受限。

4.Fuccio住院患者预测模型

与前述模型多基于患者相关因素开发不同,2019年意大利学者Fuccio等在纳入12家中心1 524例住院患者的前瞻性、观察性研究中,建立了基于住院患者相关和肠道准备相关因素的模型,纳入分次方案、使用1 L聚乙二醇(polyethylene glycol,PEG)、卧床状态、便秘、糖尿病、抗精神病药物使用和住院7 d以上共7个危险因素,模型的校准性(AUC:0.78)和鉴别力(Brier's评分:0.17)均较好。另外,研究者基于该模型还开发了简便易用的在线应用程序和预测图表供临床医师预估住院患者肠道准备合格率,有助于为患者快速找到“量身定制”的肠道准备方案。利用该模型可以快速有效地区分是否需要重复结肠镜检查的患者,既不耗时又可以节省肠镜资源,但局限在于仅适用于住院患者。

5.Berger风险评分预测模型

2021年法国学者Berger等在纳入561例结肠镜检查患者的单中心研究中,采用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)惩罚logistic回归建立预测模型,纳入糖尿病/肥胖、不规律体力活动、肝硬化、使用抗抑郁药/镇静剂、使用阿片类药物、腹部或盆腔手术史和肠道准备失败史7个预测变量,并建立了总分0~8分的“Prepa⁃Co”评分量表,模型受试者工作特征曲线的AUC为0.622,敏感度为45.7%,特异度为75.8%,阳性预测值为38.6%,阴性预测值为80.8%。不同于此前模型多通过查阅病历回顾性创建,Berger通过自我管理的问卷方式收集简单的临床变量,所纳变量较少且便于收集和评估,有助于识别肠道准备失败的高风险患者。需指出的是,该研究中肠道准备不合格定义为波士顿评分(BBPS)总分≤7分或任一肠段评分≤1分,可能导致肠道准备不足比例被高估,进而导致Prepa⁃Co的预测效果低于此前模型。

6.Kurlander风险评分预测模型

2021年美国学者Kurlander等在纳入6 885例门诊行结肠镜检查的退伍军人的研究中,分别采用常规logistic回归和随机森林机器学习(random forest machine learning,RFML)的方法建立了肠道准备预测模型。logistic回归模型中依次纳入肝硬化、慢性肾脏疾病、6月相对于1月的检查、吸烟史和糖尿病5个变量,RFML模型则纳入了月份、体重指数、年龄、过去2年初级保健就诊次数和内镜医师身份5个变量。在logistic回归和RFML模型中,训练队列受试者工作特征曲线的AUC分别为0.72和0.65,验证队列中则为0.66和0.61,在验证队列中Brier's评分分别为0.11分和0.12分,预测性能总体相近,但logistic回归模型准确率更高(64%比60%)。两种模型在总体性能上相当,但预测价值有限,难以用于临床实践,且由于是纳入男性退伍军人为主要受试者的单中心回顾性研究,从电子健康档案中提取预测变量无法对准确性进行验证,因此结论推广受限。该研究的一大突出亮点是使用源自人工智能领域的机器学习算法,开发新一代预测工具以求改进旧模型,与传统统计学方法相比,现代的机器学习使用大量数学运算来更好地定义预测因子与结果间的复杂关系,它的优点包括能够处理大量的变量,识别意外的交互,并解释大量丢失的数据。

二、国内的结肠镜检查前肠道准备失败风险预测模型

2017年李月月在纳入1 504例患者的单中心前瞻性研究中,采用多因素logistic回归方法制定出首个针对中国人群的肠道准备失败风险预测模型及量表,纳入年龄≥60岁、体重指数>30 kg/m2、服用三环类抗抑郁药、糖尿病、慢性便秘、结直肠手术史、ASA评分≥3分及住院状态8个危险因素,量表总分0~20分。模型受试者工作特征曲线的AUC为0.715,敏感度为57.0%,特异度为74.9%,阳性预测值为42.7%,阴性预测值为84.1%。2020年鉴海旭证实该模型预测准确性高,可准确识别出肠道准备失败风险的患者,从而采取个体化肠道准备方案,并显著提高肠道准备质量、息肉及腺瘤检出率。

2020年李健民等在纳入455例患者的回顾性研究中,基于最优子集法模型开发出肠道准备列线图风险评分工具:高纤维饮食、糖尿病、便秘、检查前无准备活动4项作为评分项,总分>130分时肠道准备不足风险超过50%。该工具的准确率、敏感度更高,仅纳入4个临床中较易获取的数据变量,计分方法简单易行,更适合在患者肠道准备前推广应用。列线图作为一种可视化风险预测模型表现形式在近年来愈加受到重视,可简单快速地计算肠道准备不足风险,并将logistic回归结果进行可视化处理,可更直观地用于个体风险的预测指导17]。但该模型作为一项单中心回顾性研究,建模样本量较少,且数据源于问卷或随访,因此可能存在回忆偏倚。

不同于仅基于患者相关因素开发的模型,2022年Chen等对5家中心906例上午行结肠镜检查的患者的前瞻性研究中,采用多因素logistic回归分析首次建立了肠道准备相关模型(preparation⁃related model,PRM)、患者相关因素模型及组合模型。在受试者工作特征曲线的AUC比较上,PRM模型(0.81)和组合模型(0.84)显著高于患者相关因素模型(0.64)、Hassan模型(0.61)、Dik模型(0.61)及Gimeno⁃García模型(0.58),内部验证时结果亦然。PRM及组合模型中的预测风险与实际观察到的风险较为接近(R2分别为0.315和0.332),PRM模型因仅含3个预测因素,风险评分简便易行,更适合临床实践中预测肠道准备质量,但对下午行结肠镜检查患者的预测价值有限。

2022年徐苗苗等以老年人为研究对象,开发出涵盖年龄>65岁、体重指数≥24.0 kg/m2、便秘、糖尿病、结直肠手术史、首次结肠镜检查6项变量的老年患者肠道准备失败预测模型,总分0~18分,受试者工作特征曲线的AUC为0.717,敏感度为50.89%,特异度为79.59%。该模型可为医护人员评估老年患者结肠镜检查肠道准备失败风险及制订干预方案提供参考,但因仅在1家医院建模、纳入样本量有限且未行外部验证,未来仍需多中心大样本研究以验证其效能。

三、肠道准备失败风险预测模型的研究特点

从目标人群来看,模型大多基于各地区人群开发,受限于人种族群、社会环境、经济文化等差异,地区之间是否适用不得而知。各模型预测因子不完全一致,表明不同人群肠道准备失败危险因素有所不同,且不同于欧美地区推荐的4 L PEG方案,我国肠道准备指南推荐将3 L PEG作为肠道准备的标准剂量。因此,未来研究者可根据人群特征和适宜的肠道准备方案,采用多中心联合的方法开发本土化、实用性强的预测模型,并进一步评估和优化对不同族群的预测性能,探索适于各地区人群的肠道准备失败风险预测模型。在此基础上,探索开发老年人、儿童、糖尿病及便秘患者等特殊人群肠道准备失败预测模型可以更加高效筛选高危患者从而精准施策。

从设计方法来看,有8项前瞻性研究、2项回顾性研究(表1)。相对而言,回顾性研究难以保证数据的完整性和同质性,研究质量一般,如处理不当势必影响模型预测性能。上述10项研究均为模型开发研究,部分研究基于回顾性资料开发模型,尚未经过多中心前瞻性的临床验证,限制了模型的推广应用。


从纳入影响因素分析,研究多采用Logistic多因素分析,模型纳入危险和保护因子仍不全面,且以患者相关因素居多,而肠道准备相关因素较少,部分研究在数据分析方面未报告缺失数据处理方法以及数据复杂性,部分研究筛选预测因子方法并不恰当。当前模型常纳入的年龄、性别、吸烟、糖尿病、便秘、肠道准备失败史等因素之间具有极为复杂的交互作用。未来,研究人员可参考PROBAST风险预测模型评估工具评价模型偏倚风险及适用性,在对已有模型验证的基础上探索新的预测因子

从模型的验证分析来看,有9项研究进行了内部验证以减少模型过拟合,从而得到更可靠的模型来预测准确性评估值。2项研究进行了外部验证,主要是通过临床应用评价模型的预测性能,并整合利用外部验证集和开发集资料后重新建模,动态更新优化模型,为更大范围应用奠定基础。仅1项研究进行了内部和外部验证,因绝大部分未行内、外部验证,所以无法评价模型间的预测性能及优劣。

四、人工智能在结肠镜检查前肠道准备评估中的研究与应用

近年来,人工智能在消化内镜领域发展迅速,依托人工智能评估肠道准备质量有望成为一种稳定、客观、准确评估肠道准备的自动化工具。

2021年,Zhou等基于深度学习的定量肠道准备系统开展了前瞻性观察性多步骤验证研究,使用深度学习模型开发了一个人工智能系统来自动计算波士顿肠道准备质量量表(e⁃BPPS)评分,并利用外部图像及视频验证得出该评分系统准确性较高。该评分系统可作为定量评估肠道准备质量的有力辅助工具,宏观上有助于优化肠道清洁评估,由于为结肠镜操作中及操作后的肠道准备质量评分,虽在替代内镜医师评分方面更加客观精确且高效,但作为一种“事后评分”,具体到受检者个人不具有预测意义,暂时未能开发相应预测模型。

为尽可能减少内镜医师间的不一致性,2022年Lee等依托结肠镜检查视频中开发的人工智能/卷积神经网络算法客观评估肠道准备充分性,该卷积神经网络算法基于AI⁃BBPS算法(algorithm⁃BBPS),根据每帧评分计算平均BBPS评分,得出最终平均BBPS评分。该算法在预测肠道准备失败方面,验证集中受试者工作特征曲线的AUC为0.918,准确率为85.3%,在两个测试集中敏感度均为100%,人工智能与评分者之间的一致性分别为76.7%~83.3%和68.9%~89.7%。可以说,该算法在包括完全退出结肠镜的检查中性能良好并与专家一致,其局限在于同样是一种“事后评分”,预测个体价值有限。

五、小结及展望

目前我国结肠镜检查前肠道准备失败预测模型的研究尚处于起步阶段,研究方法单一且操作复杂,缺乏多中心大样本前瞻性队列研究,模型临床实用性差、应用与推广较困难,而且关于何种预测模型最适合作为肠道准备不足的筛查工具更是缺乏指南和共识。

当前,越来越多的研究表明基于计算机技术开发的肠道准备失败预测模型具有优越性,与大数据、机器学习、人工智能领域的结合无疑是未来结肠镜检查前肠道准备失败风险预测模型发展的趋势之一。因此,该方向的研究应在学习借鉴国外研究的基础上,立足我国临床实际开展前瞻性、跨地域、多中心、大样本的临床试验,在传统单因素、多因素回归研究基础上,综合考虑患者一般特征、疾病因素及肠道准备三个层面的影响因素,选择合适的建模方法及模型,同时注重与大数据、机器学习、人工智能领域相结合,以开发适合我国本土使用、简便且高效精准的肠道准备不足风险预测模型及评估筛查工具。

参考文献略

来源:中华消化内镜杂志  

编辑: 朱悦  校对:周昊   审核:唐涌进



关注我们
FOLLOW US

搜索关注头条号

搜索关注微博

搜索关注企业微信


消化内镜资讯
传播消化内镜学科最新进展
 最新文章