构建logistic回归模型很简单?高分SCI文章的做法远远比你想的多
健康
教育培训
2024-07-11 08:06
浙江
Logistic回归,再普通不过的统计方法了 ,大家都在用,用于分析二分类结局的影响因素、控制混杂因素、预测阳性事件的发生概率。
咱们统计分析时,Logistic回归建模过程一般非常简单,也许做个多因素回归就算完成了,或者折腾个“先单因素再多因素”已经很不错了。然后,看每个自变量P值是否小于0.05。在惜墨如金的中国学术杂志中,论文的统计学方法描述部分,一般会寥寥数字来写出“采用多因素logistic回归开展影响因素研究”、或者会多几句话“先单因素开展logistic回归,挑选P<0.05的开展多因素回归”。此时,你是否尴尬地笑了?这就是我们做logistic回归的方法和过程。那么,好的医学研究文章如何构建Logistic回归?又如何叙述其过程呢?也只言片语吗?
今天来瞧一篇文章,它来自于麻醉下领域一区杂志 《Anaesthesia》。它的Logistic回归的过程值得大家思考和学习。这篇文章分析急诊手术的时间是否与术后死亡率有关。研究评估了2010年4月至2015年3月在加拿大魁北克医院进行急诊手术的9319例患者的首次手术时间与术后30天内死亡率相关性。在7362例(80%)完整数据的患者中,有168例(2.3%)术后30天内死亡。结果发现,一天中的手术时间与术后死亡率没有显着相关性,夜间与白天的调整后OR(95%CI)为1.61(0.96-2.72),P = 0.07;夜晚vs夜晚1.29(0.78–2.13),P = 0.33;晚上与白天的差异OR为1.26(0.89–1.78),P = 0.20。简答来说,这个 研究因素是不同时间,结局是二分类结局(是否死亡),因此采用logistic回归分析。我们看看该论文是如何详细描述logistic回归分析过程的。首先,logistic回归分析前,对暴露因素进行鉴定:我们将一天分为三个时期,与护理班次的开始时间一致:07:30(“天”);15:30(“晚上”)和23:30(“夜晚”)在调整暴露和结局的可能原因后,我们使用Logistic回归分析研究了时期与死亡率的关系。接着,指出回归可能存在着的混杂因素,回归分析要纳入的控制变量考虑的协变量为:年龄、性别、ASA身体状况;紧急类别、手术日、麻醉持续时间、和手术类型。我们将年龄和总麻醉时间建模为连续变量,将ASA身体状况建模为五个类别之一,手术时间分为周末/节假日或工作日。我们将手术类型分类为:普通手术、耳鼻喉、神经外科、产科、骨科、心血管或胸腔、 泌尿科或其他。通过Box–Tidwell检验评估连续变量对数的线性条件进行诊断用Pearson相关系数统计量的多重线性,并通过在具有相同因变量和自变量的多元回归模型上检查方差膨胀系数来评估多重共线性。使用负二倍对数似然比检验来检验模型的整体重要性。模型的拟合度通过Hosmer-Lemeshow拟合度卡方检验进行评估。我们使用预测值、皮尔逊和偏差残差绘制了一些针对预测值的诊断统计数据,评估异常值并检测有影响力的观察结果 。在逻辑回归模型中,只有在所有变量中均具有完整数据的受试者队列才被视为才会被考虑进来分析。我们使用了多种估算来评估缺失值对结果的敏感性。这些logistic策略真的值得我们去学习!重点包括自变量筛选方式、自变量类型(需要转换吗?)、logistic回归线性诊断、多重线性诊断、模型总体模型评价、缺失数据如何处理。。。。这些你之前在开展logistic回归时可曾考虑到?2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看:浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情:
|