SEER公共数据库、没有花哨的统计学方法|一篇IF12.5的文献解读

企业   2024-10-14 09:14   中国  
面对高分文章中复杂的统计学分析,您是否有些无从下手;对于队列研究不知道该采用什么合适的统计分析方法;对于R语言没有完全掌握,无法进行各种模型计算。那就让我们转换一下思路,今天我们带来一篇高分回顾性研究,采用了清晰的统计学方法,使用了Kaplane-Meier方法和Cox比例风险回归模型,就发布在了期刊《International Journal of Surgery》(医学二区,IF=12.5)上。
这篇回顾性研究《A nomogram to predict prognosis after surgery in early stage non-small cell lung cancer in elderly patients》(中文名:预测老年早期非小细胞肺癌术后预后的列线图),旨在确定影响早期NSCLC老年患者总生存期(OS)的危险因素,并使用SEER数据库建立预测患者预后的列线图。
接下来就让我们一起来看一下如何采用公共数据库结合清晰的统计学方法发表一篇高分回顾性研究文章!

研究人群

患者信息来源于SEER数据库,SEER是美国国家癌症研究所(NCI)创建的一个公共数据库和研究资源。SEER数据库收集和储存了全美范围内的癌症发病率、生存率和治疗数据,以支持癌症研究和流行病学调查。
最终纳入20,782名≥65岁早期(T1N0M0)NSCLC患者符合条件的患者,并获得每位患者的以下信息:诊断年份、年龄、性别、患病肺叶位置、病理类型、直径、分化、手术类型(楔形切除术,节段切除术或肺叶切除术)、生存信息和死亡原因,数据缺失的患者被排除在外。
表1 患者特征和5年总生存率

统计分析与研究结果

Kaplan-Meier方法

Kaplan-Meier方法常用来进行生存分析,是一种非参数方法,用于根据观察到的生存时间估计生存概率,一般接触较多的是Kaplan-Meier生存曲线,可通过生存曲线直观地反应不同情况下患者生存差异,一般随访时间为X轴,生存率为Y轴;曲线平滑则说明高生存率,反之则低生存率。
结果显示肺切除术后的中位随访时间为25个月,肺切除术后的累积疾病特异性5年生存率为55.9%。
图1 所有患者的总体Kaplan-Meier生存曲线。

单因素和多因素分析

在统计学中,单因素分析和多因素分析是两种常见的分析方法,用于研究变量之间的关系。文章为了确定生存的预测因素,20782例患者均被纳入单因素和多因素分析。
结果显示:年龄、性别、病理、分化、直径、手术类型等均对患者的预后和生存有显著影响。
图2 根据(a)年龄,(b)性别,(c)病理类型,(d)分化,(e)肿瘤直径和(f)手术类型的患者的总体KM生存曲线

Cox回归分析

Cox回归,也称为Cox比例风险模型,是生存分析中广泛使用的统计方法,在医学研究中广泛应用于研究患者生存时间与多种危险因素或预后因素之间的关系
文章使用Cox回归分析进一步探讨性别、年龄、病理、分化程度、肿瘤直径、手术类型等因素的影响。结果表明,这些因素均是影响预后的独立危险因素(p<0.001),且预后不受肿瘤位置的影响(表1)。

列线图

列线图,又称诺莫图(Nomogram图),是建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系列线图常被应用于风险评估、预后评估和治疗决策
文章以性别、年龄、病理、分化程度、肿瘤直径、手术类型为预测指标,评估了患者3年和5年OS。为了计算3年和5年的OS率,首先需要根据列线图顶部的点比例确定每个因素,然后对每个因素的点进行求和。最后,根据列线图的底部点尺度得到3年和5年的OS率。
图3 预测早期NSCLC老年患者3年和5年OS率的列线图

列线图的校准曲线

为了增加列线图的可信度,采用了校准曲线来进一步验证列线图的准确性。结果可见,预测概率与实际概率较为接近,提示列线图具有较强的预测能力。
图4 预测早期NSCLC老年患者(a)3年和(b)5年OS率的列线图的校准曲线

总结

这是一篇回顾性研究,并且其中采用的统计方法并不复杂,但其发表在IF12.5的期刊上,必有其亮点:
公开数据库发文流程:这篇文章全面介绍了如何利用公开数据库进行文章发表的完整流程,包括研究方法和研究过程的详细阐述,极具参考价值。此外,SEER数据库是全球最全面的癌症数据资源之一,蕴藏着丰富的数据宝藏,值得深入挖掘。对此感兴趣的读者,我们将在后续推出一系列关于SEER数据库的文章,敬请期待。
统计分析方法清晰合理:文章采用了生存分析常用的KM方法、Cox回归分析和列线图,条理逻辑清晰,并且最后还验证了模型实用性,增加了文章内容可信度。

以上就是关于这篇回顾性研究的解读,对于还没开始写文章、没有行文思路的小伙伴不妨阅读原文看看,学习一下如何使用公共数据库和简单的统计分析写出一篇高分文章,可以给大家一些思路。我们下次再见~

往期推荐



1.中医针灸RCT研究,如何发表在19.6分的SCI期刊上?|文献解读
2.利用UKB公开数据库也能发JAMA?他们是如何做到的|文献解读
3.如何开展诊断试验研究 | 附24篇高分文献
4.浅谈随机对照研究 | 附36篇高分文献
关于斯录欣Solution
易侕科研隶属于斯录欣(上海)信息科技有限公司,公司成立2014年,是一家高新科技企业。斯录欣由临床研究专家、统计学家组建,公司聚焦于临床研究、数据服务,欢迎和我们联系。
电话:15007152536 (同微信)
邮箱:bp@yunedc.com
官网:http://www.siluxintech.com
👇点击阅读原文查看文献

易侕科研
专注于临床科研数据管理+数据分析。定期分享一些研究设计、数据分析的内容,也会推荐一些好用的科研工具和网站。每天10min,让科研更简单!(本账号原名为:易侕统计。本账号为斯录欣公司旗下产品,2018年更名为:易侕科研)
 最新文章