本文介绍了利用MSTATA软件,上传数据后,一键完成 Cox - nomogram(列线图)的临床预测研究分析,生成nomogram, ROC, calibration, DCA等,并自动撰写生成一篇 SCI 论文初稿。整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。论文共3000 余字,经过简单人工处理后即可投稿。
众所周知,chatGPT可以撰写一些论文的片段,但根据用户自己的数据生成统计图表,并且撰写全文,对于chatGPT来说,目前还很困难,出来的文章质量很糟糕,错漏百出,更别说到发表级了。
目前如果需要让人工智能根据用户自己的数据一键完成统计分析的同时,秒出论文并达到发表级,只有www.mstata.com 能够做到。
这里我们以目前很热门的 Cox - nomogram 临床预测研究为例,看看Mstata是如何自动生成发表级论文的:
请到下面的网址体验一键生成 SCI 论文的乐趣:
进入www.mstata.com 左侧选MSTATA > 按照研究类型分类 > 传统预测研究 > Cox- nomogram 预测研究开始
本工具能够一键完成 Cox - nomogram(列线图)的临床预测研究分析,并自动生成一篇 3000 多字的 SCI论文初稿。包括标题、背景、方法、结果、参考文献。除了讨论部分需要用户自行撰写外,其他部分均已经完成初稿。
分析的流程为:上传数据 -> 处理数据 -> 拆分训练集和验证集 -> 基线特征表 -> Lasso 回归筛选变量 -> Cox 建模 -> 绘制普通 nomogram -> 在训练集和验证集整体评价ROC -> 绘制 calibration 校准曲线 -> 绘制 DCA 曲线 -> 制作一个互动 nomogram 并部署到个人网站 -> AI 撰写论文
整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。
Nomogram,也叫作诺模图,是一种图形计算器,用于将数学公式或者复杂的统计模型转化为直观易用的图表。诺模图是一种强大的工具,可以用于可视化复杂模型的预测,通过滑动各变量标尺,就可以直观地得到预测结果,从而可以有效地为决策提供依据。在医学研究中,尤其是临床决策中,使用 nomogram 可以便捷地预测疾病的风险,评估治疗方案的效果等。
例如,在研究某种肿瘤的总生存预测时,我们可以将年龄、性别、肿瘤大小、肿瘤分期等因素作为预测变量,结合 Cox 回归模型,制作出一个 nomogram。通过该 nomogram,我们可以快速直观地了解在不同年龄、性别、肿瘤大小和肿瘤分期情况下,患者的总生存预期。
对于如何在 MSTATA 中实现绘制 Cox 回归的 nomogram,MSTATA 统计软件提供了丰富的功能支持,包括:
1) 一键拆分训练集和验证集
2)一键生成基线特征表
3)一键完成 Cox 建模
4)绘制经典 nomogram:MSTATA 不仅可以实现 Cox 回归模型的构建和评估,还可以直接生成 nomogram,将复杂的模型转化为易于理解的图形,帮助用户直观地理解和解释模型结果。
5)绘制网页动态 nomogram:这是一个相对更加现代化的方式,用户可以在网页上交互式地操作 nomogram,调整预测变量的值,并直接看到预测结果的变化。这种方式可以使nomogram 更加动态,有助于更深入地理解模型。
6)一键部署到用户的个人网站:MSTATA 还提供了一键部署的功能,用户可以将自己制作的动态 nomogram 部署到自己的个人网站上,提供给其他人使用。而且,用户可以将自己部署nomogram 的网址附在论文里,使得读者能够更方便地使用 nomogram,增强论文的可读性和实用性。
7)一键完成 ROC 曲线
8)一键完成 Calibration 校准曲线
9)一键完成 DCA 曲线
10)一键完成 SCI 论文的撰写
综上所述,无论是经典的 nomogram 还是动态的 web 版 nomogram,都可以在 MSTATA 中轻松实现。这无疑使得 MSTATA 成为了一款强大的统计分析和可视化工具。
下面是使用方法:
步骤1:选择您的数据并加载到MSTATA。
上传数据后,如果有缺失数据,缺失值在20%以下的变量,可以酌情考虑做缺失值填补,这里首选随机森林法进行填补。缺失值20%-40%的变量,需要慎重考虑;缺失值40%以上的变量,建议不放入模型。
有两种数据模式,有外部验证集和没有外部验证集。
没有外部验证集,只有内部集时,请按照以下方式准备数据:
这里包括生存资料的结局 time 和status, 以及多个预测因子。
如果既有内部集,又有外部验证集,请把两个集合在一起准备数据:
这里把内部集和外部集纵向合并起来,并增加一列在末尾,标示出那个是内部集,哪个是外部验证集。
后面分析的时候,系统会按要求将内部集拆分成训练集和内部验证集。然后以训练集、内部验证集、外部验证集三个队列来分别做基线人口学特征表。
步骤2:拆分数据集并生成基线表。
步骤3:先做一个单因素 Cox 回归进行初步分析和探查
步骤4:lasso回归筛选变量
步骤5:多因素建模
步骤6:绘制 nomogram
步骤7:对最终模型做 ROC 评价
步骤8:绘制calibration校准曲线
步骤9:绘制DCA曲线
步骤10:生成动态列线图并部署到个人网站
步骤10:下载word报告
步骤11:生成一篇 SCI 论文