今天解读的是发表在 eClinicalMedicine(IF=9.6)上的一篇文章《Development and validation of a model to predict cognitive impairment in traumatic brain injury patients: a prospective observational study》。本文是一项前瞻性观察研究,旨在开发并验证用于预测创伤性脑损伤(TBI)患者认知障碍的模型。
01背景介绍
TBI 的影响:TBI 是全球性公共卫生问题,每年影响超 5000 万人,不仅带来即时后果,还造成长期影响,尤其是认知障碍,给患者康复和日常生活带来重大挑战。
研究现状与需求:尽管已识别出一些影响 TBI 后认知障碍的因素,如初始损伤严重程度、损伤性质和位置、昏迷持续时间、患者年龄、既往疾病和遗传因素等,但因个体反应和恢复轨迹差异,尚无普遍接受的预测模型。早期识别影响认知恢复的因素对改善患者预后至关重要,可实施针对性康复策略、制定个性化治疗计划、减轻社会经济负担。因此,开发并验证 TBI 患者认知障碍预测模型意义重大。
02研究方法
数据来源
训练队列:234 例 TBI 患者,于 2017 年 5 月至 2020 年 4 月入住苏州大学附属第三医院神经外科,数据源于团队此前发表的研究。纳入标准为年龄≥18 岁、首次发生颅脑外伤、出院时意识清醒;排除标准包括合并导致中枢或周围神经系统损伤的疾病、导致认知障碍的疾病、因意识障碍妨碍认知评估、严重失语、出院后 1 个月拒绝随访和认知测试。
验证队列:2024 年 3 月 1 日至 2024 年 8 月 30 日入住苏州大学附属第三医院神经外科的 TBI 患者。最初收集 97 例患者临床信息,13 例因不符合标准被排除(5 例昏迷、3 例严重失语、1 例年龄<18 岁、4 例拒绝随访),最终纳入 84 例患者 。
分析方法
样本量计算:基于事件变量比(EPV)计算样本量。已知训练队列中 TBI 后 1 个月认知障碍发生率为 0.72,计划纳入 6 个预测变量且 EPV 设为 10,通过公式计算得出所需样本量为 214,实际纳入 234 例患者。
数据收集:收集患者多方面数据,包括基线特征(性别、年龄、受教育年限等)、病史(高血压、糖尿病等)、临床 TBI 特征(初始格拉斯哥昏迷量表(GCS)评分、TBI 放射学特征等)、治疗细节(癫痫、肺炎等发生情况,手术治疗等)和住院期间生命体征(体温、平均动脉压等及多项血液学参数)。
数据处理与分析:数据采用了多重填补法处理缺失数据,基于标准建议进行 10 次填补。连续变量用预测均值匹配法填补,分类变量用逻辑回归填补,多项分类变量用多项逻辑回归填补。用 Shapiro - Wilk 检验评估连续数据正态性,正态分布数据以均值(标准差,SD)表示,非正态分布数据以中位数表示,分类数据以频率(百分比)表示。两组正态分布连续数据比较用 t 检验,非正态分布数据用 Mann - Whitney U 检验,分类数据比较用检验或 Fisher 精确检验,双侧为差异有统计学意义。通过相关性分析,根据数据特征和研究问题选择 Pearson 或 Spearman 方法,并绘制了热图可视化相关系数(图 2 展示了训练队列中预测变量的相关性热图)。
模型构建与评估:比较多种机器学习算法预测模型,包括支持向量机、随机森林、K 近邻和广义线性模型。在训练队列和验证队列中分别评估模型性能,通过受试者工作特征曲线(ROC)下面积(AUC)、敏感性、特异性评估模型区分能力,用校准曲线和临床决策曲线(DCA)评估模型有效性。采用最小绝对收缩和选择算子(LASSO)方法进行变量选择,选择 LASSO 回归模型中非零系数的自变量,再通过多因素逻辑回归确定潜在预测因素。构建列线图预测 TBI 后认知障碍,列线图总分是各风险因素得分之和,得分越高认知障碍风险越大。通过计算 ROC 曲线下面积(AUC)评估模型区分能力,用最大约登指数确定诊断测试最佳阈值,绘制校准曲线和临床决策曲线验证预测模型准确性。对于验证队列,预设 AUC 可接受性能差异小于 0.05,评估模型在不同队列中的适用性。
03结果
结果总述:确定了 6 个影响 TBI 患者认知障碍的独立预测因素,构建的列线图模型在训练队列和验证队列中均展现出良好的预测准确性和临床实用性。
分点结果
一般特征:训练队列 234 例患者中,170 例(72.65%)有认知障碍,130 例为男性,平均年龄 52.26 岁;64 例认知正常,54 例为男性,平均年龄 37.75 岁。验证队列 84 例患者中,50 例(59.52%)有认知障碍,34 例认知正常。训练和验证队列间有 5 个变量存在显著差异,分别为出院时血小板计数、血清钾、C 反应蛋白(CRP)、D - 二聚体和赫尔辛基评分。
预测因素筛选:通过十折交叉验证确定 LASSO 模型最优调谐参数 λ,检测到 8 个非零系数变量,构建多因素逻辑回归模型后确定 6 个显著风险因素,即年龄、受教育年限、肺部感染状况、癫痫状况、脑脊液漏状况和赫尔辛基评分(表 2 展示了各因素的回归结果)。
年龄对预测的贡献度最高(0.14),癫痫状况最低(0.01)(图 4 展示了各因素对预测的贡献度)。
列线图开发与验证:基于 6 个预测因素构建列线图(图 5A 为列线图,图 5B 为在线计算器)。
在训练队列中,列线图 AUC 为 0.91,校准曲线与理想对角线紧密对齐,DCA 显示模型净效益在广泛阈值概率范围内大于两种极端策略。验证队列中,模型 AUC 为 0.87,校准曲线表现良好,DCA 同样显示模型净效益优势(图 6 展示了训练和验证队列的 ROC 曲线,图 7 展示了校准曲线,图 8 展示了 DCA 曲线)。
图7 校准曲线
图8 DCA曲线
04局限性
样本设计局限:研究缺乏前瞻性多中心大样本设计,一定程度上限制了研究结果的普遍适用性和外部推广性,后续需多中心大样本研究进一步验证模型。
病例类型影响:研究纳入较多轻至中度 TBI 病例,可能影响模型对更严重病例的检测效果,但这反映了中国脑损伤的现状。
损伤位置分类粗糙:将脑损伤位置分为硬膜外、硬膜下和脑内三类,未区分具体脑叶,虽通过 CT 评分改进,但仍存在一定局限性。
小编说明:
本研究首次构建了专门针对 TBI 患者认知障碍的预测模型,为临床医生提供了早期识别高风险患者的实用工具,有助于制定个性化干预策略,降低患者长期认知缺陷风险,提高生活质量。然而,研究存在一定局限性,未来研究可在扩大样本量、纳入更多中心数据、细化脑损伤位置分类等方面加以改进,进一步完善 TBI 患者认知障碍预测模型,推动 TBI 临床诊疗发展。
结语
临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题,同时,为即将发生的临床难题提供备选解决方案。
打开极智分析—智能医学统计分析平台 https://www.xsmartanalysis.com/ 进行实操吧!
往期精彩回顾
【1】发文没思路?GBD数据库+流行病学分析=深度剖析全球胃食管反流病负担
【4】《Cardiovascular Diabetology》IF=8.5,预测老年心力衰竭合并高血压患者死亡率?机器学习模型给出结果
扫二维码
关注我们
公众号|极智分析
知乎|极致分析
B站|极智分析