近年来,临床预测模型在医学研究中越来越受欢迎,它可以帮助医生更好地理解疾病的进程,为患者提供个性化的治疗方案。模型能够综合各种线索,从你的年龄、性别、基因密码,甚至是你的生活方式,从而预测你是否会生病,或者预测疾病的发展走向。
如何构建临床预测模型?
临床预测模型的构建是一个复杂的过程,主要包括以下几个方面:
确定目标和终点:首先需要明确预测模型的目标,即预测的诊断或预后终点是什么。这些模型旨在提供绝对风险的估计值。例如,模型可能是预测某种疾病的发展、疾病复发的风险,或者是患者的生存期。
数据收集:模型的数据可能来源于不同研究的汇总分析。这可能包括从多个研究中心或多个研究中收集的数据,以便构建和验证模型。
选择预测因子:确定哪些变量(预测因子)可能与预测目标相关,并将其纳入模型。这些变量可能包括人口统计学特征、临床特征、实验室检查结果等。
模型开发:使用统计方法和机器学习技术来开发模型,这可能包括逻辑回归、决策树、随机森林、神经网络等方法。模型开发过程中需要评估不同预测因子的效果,并进行异质性检验。
模型验证:开发完成后,需要在独立的数据集上验证模型的预测性能,这包括校准(calibration)和区分度(discrimination)。模型的校准是指模型预测的概率与实际发生的概率之间的一致性,而区分度则是指模型区分不同结果的能力,常用的统计指标包括c指数(c-index)。
模型调整和优化:根据验证结果对模型进行调整和优化,以提高其预测准确性和泛化能力。这可能涉及到对模型参数的调整,或者是对模型结构的改进。
外部验证:模型还需要在不同的人群或设置中进行外部验证,以确保其在不同的临床环境中都具有良好的预测性能。
系统评价和元分析:在模型开发和验证过程中,系统评价和元分析被用来评估和比较不同模型的性能。这包括对现有模型的系统评价,以及对多个模型的预测性能进行元分析。
临床应用:最后,经过验证和调整的模型可以用于临床实践,帮助医生和患者做出更准确的预测和决策。
临床预测模型的主要用途
临床预测模型是一种在医学领域内广泛应用的统计工具,它们通过分析患者的特征和医疗数据来预测疾病的风险、预后和治疗效果。这些模型的主要用途包括支持医疗决策、预防疾病的发生、实现早期诊断、评估患者的预后、提升医疗质量管理、优化医疗资源配置、指导医学研究设计和分析、促进患者教育和行为改变、提高治疗效率以及推动个性化医疗的发展。通过这些应用,临床预测模型不仅能够改善患者的预后,还能提高医疗服务的效率和质量,为现代医学实践提供了宝贵的支持。
预测模型发表趋势(来源pubmed.pro)
现在,我们应该大致了解了临床预测模型,接下来让我们来聊聊Meta分析(前不久小编发了两篇meta分析的文献解读,有兴趣的小伙伴可以去看看哦),Meta是对现有证据的一个概括论证,如果能综合多篇文章的结论,重新构建一个预测模型,则从某种程度上相当于合并了多种数据进行了建模,当然,早有学者想到了这一点,接下来就让我们用一篇文章看看这两“高手”强强联手,能擦出怎样的火花。
这篇文章是发表在《Diabetes/Metabolism Research and Reviews》上的“Development and validation of a risk prediction model for the recurrence of foot ulcer in type 2 diabetes in China: A longitudinal cohort study based on a systematic review and meta-analysis”,旨在基于荟萃分析和纵向队列研究,开发并验证糖尿病足溃疡(DFU)复发风险预测模型。
研究设计与方法
建模队列和验证队列
研究使用14个队列的荟萃分析得出的建模队列。根据荟萃分析设定了纳入标准,并将参与者分为建模队列和验证队列。
图1 患者选择流程(A) 建模队列。(B) 验证队列
模型开发与验证
从病历中收集了各种风险因素,并基于这些因素开发和验证了三个模型。
模型1:直接利用meta分析中识别出的危险因素进行建模,包括性别、糖尿病病程、既往糖尿病足溃疡病史、溃疡部位、吸烟者、截肢史、足部畸形等。
模型2:在模型1基础上建立,采用logistic单因素回归分析,在全数据集内筛选变量,包括logistic多因素回归中p值<0.1的变量,筛选出p值<0.05的危险因素,剔除实验室指标。
模型3:在模型2基础上建立,包含实验室指标。
采用logistic回归筛选危险因素,通过多因素logistic回归建立预测模型方程,但多因素模型通过bootstrap程序(放回抽样1000次迭代)进行内部验证,以评估偏差校正后的预测能力估计值。计算曲线下面积(AUC)以评估模型的判别能力。采用受试者工作特征曲线(ROC)计算AUC及其95%置信区间(CI)。AUC值越接近1,表示模型的预测效果越好。当AUC大于0.7时,表明判别力与预测能力呈正相关。此外,通过临床决策曲线评估模型的临床有效性或实用性。
结果
基线特征
建模队列共纳入1027名参与者,而验证队列共纳入306名参与者。验证队列和建模队列在社会人口统计学特征、体检指标和实验室指标方面总体相似。
模型开发
首先需要确定模型中的危险因素,因此研究人员使用了logistic回归,可以帮助了解不同自变量(如年龄、性别、症状等)与疾病发生之间的关联性,并估计在给定自变量条件下疾病发生的概率。
单因素和多因素logistic回归计算危险因素(详见表2),最终具有统计学意义的危险因素为:溃疡部位、足部畸形、BMI、糖尿病病程、收缩压、血尿素氮(BUN)、纤维蛋白原、糖化血红蛋白、低密度脂蛋白胆固醇(LDL-C)、使用的他汀类药物和使用的抗血小板药物。
表2 建模队列中的逻辑回归分析
模型验证及校准
模型建立后需要对模型进行性能评估。而判断预测模型的好坏主要取决于两个指标:1. 区分度; 2. 校准度。区分度一般用AUC来判断,通过计算约登指数,约登指数的值越大,说明试验的准确性越高。它反映了在实际情况中,将一个样本正确分类为阳性或阴性的能力。理想情况下,约登指数应接近1,这意味着诊断试验既能准确地将患病者识别出来,又能准确地将未患病者排除。
表3列出了建模队列和验证队列中各模型的ROC曲线下面积和性能。图2显示了ROC曲线。所有模型都表现出了良好的区分度。模型的AUC值范围从0.781到0.899,表明了良好的判别能力。其中模型3的整体性能最好,其次是模型2和模型1。
表3 对糖尿病足部溃疡复发风险的预测性能
图2 队列和验证队列中糖尿病足部溃疡复发风险的ROC曲线
校准度是预测模型性能的一个重要方面,它指的是预测风险和观察的实际频率之间的一致性。如果模型的校准度能差,即预测概率与实际观察到的结果不一致,那么模型在新患者群体中的可信度和实用性就会降低。
图3展示了校准度的结果。在内部引导验证中,模型1推导的曲线列线图与偏倚校正曲线和理想曲线比较接近,概率介于0~0.40之间。当概率高于0.40时,模型1可能略微高估了患病风险的概率。模型2和模型3的推导队列拟合效果很好,且表现出良好的校准度。在外部引导验证中,当概率在0~0.3和0.5~0.75之间时,模型1的预测精度可能略低或略高,但整体的95%置信区间基本在理想曲线上。模型2和模型3的验证队列拟合效果很好,且表现出良好的校准度。
图3 使用引导抽样方法的逻辑回归模型的校准曲线
决策曲线分析
在评价临床预测模型时,虽然区分度和校准度是最常用的指标,但这两类指标无法为临床决策提供参考,尤其是当存在多个预测模型时。那么该如何选择呢?决策曲线分析(DCA)就显得很有意义了,DCA可以帮助医学研究人员和临床医生在不同预测模型之间做出最优选择,以达到更好的临床预测效果。
标准净效益以Y轴到X轴的垂直距离显示,X轴表示糖尿病的阈值(阈值概率),每条线代表各个模型的临床有用性。模型1~3显示出比不干预更好的成本效益。在建模队列中,模型3显示出更高的净效益,在验证队列中,当三个模型在0.18~1.00范围内时,它们具有更高的临床效益。
图4 模型 1、2 和 3 的净收益曲线
列线图
列线图可以简单理解成将预测模型可视化成一个预测事件发生的量表,用外部数据独立的个体在模型中各个指标的评分情况来预测该个体发生时间的概率。
下图为三种模型对应的列线图。
图5 (A) 模型 1、(B) 模型 2 和 (C) 模型 3 的列线图
文章思路总结
1. 文献检索与筛选:作者从多个数据库中检索了相关的队列研究,并通过严格的筛选标准确定了20个高质量的队列研究。这些研究提供了关于DFU风险因素及其相对风险比(RR)的数据。
2. 荟萃分析:对选定的20个队列研究进行了荟萃分析,计算了每个风险因素的综合RR及其95%置信区间(CI)。荟萃分析的结果帮助作者确定了哪些风险因素在多个研究中一致显示出显著的统计学意义。
3. 风险因素的选择:在荟萃分析的基础上,作者选择了那些在多个研究中一致显示为显著的风险因素。具体来说,作者选择了以下9个风险因素:
性别(Sex) 体重指数(BMI) 糖化血红蛋白(HbA1c) 吸烟史(Smoker) 糖尿病肾病(DN) 糖尿病视网膜病变(DR) 糖尿病周围神经病变(DPN) 间歇性跛行(Intermittent Claudication) 足部护理(Foot care)
4. 风险评分系统的构建:对于每个选定的风险因素,作者计算了其对应的b系数(风险指数),表示该风险因素每增加一个单位时疾病风险的倍数。然后,将b系数乘以10并四舍五入到最接近的整数,得到每个风险因素的得分。所有风险因素的得分相加,得到总分,范围从0到80分。
5. 模型验证:使用来自天津医科大学朱宪彝纪念医院的465名2型糖尿病患者的数据,对预测模型进行了外部验证。通过受试者工作特征曲线(ROC曲线)评估了模型的预测准确性,并确定了最佳的截断值(46.5分)。
结语
本文基于Meta分析识别出的关键危险因素构建了预测模型,用其他研究的数据作为建模队列,用自己的原始数据作为验证队列,属于一种新的研究思路。文章详细阐述了模型的构建与开发过程,具有很强的参考价值。所有风险模型均经过了严格的内部和外部验证,确保了预测结果的可靠性。最终,通过列线图的形式直观呈现预测模型,增强了模型的可理解性。总体而言,文章逻辑严密,表述明晰,是一篇值得学习的作品。
以上就是文章的全部解读啦,有兴趣的小伙伴欢迎点击“阅读原文”查看文献哦,觉得文章还不错的同学,可以点击在看哦,就让我们下期再见吧!