本文介绍了利用MSTATA软件,上传数据后,一键完成Logistic - nomogram(列线图)的临床预测研究分析,并自动生成一篇 30 多页的 SCI 论文初稿。整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。论文共3000 余字,经过简单人工处理后即可投稿。
众所周知,chatGPT可以撰写一些论文的片段,但根据用户自己的数据生成统计图表,并且撰写全文,对于chatGPT来说,目前还很困难,出来的文章质量很糟糕,错漏百出,更别说到发表级了。
目前如果需要让人工智能根据用户自己的数据,秒出论文并达到发表级,只有www.mstata.com 能够做到。
这里我们以目前很热门的 Logsitic - nomogram 临床预测研究为例,看看Mstata是如何自动生成发表级论文的:
请到下面的网址体验一键生成 SCI 论文的乐趣:
进入www.mstata.com 左侧选MSTATA>按照研究类型分类>传统预测研究>Logistic - nomogram 预测研究开始
此工具能够一键完成Logistic - nomogram(列线图)的临床预测研究分析,并自动生成一篇 30 多页的 SCI论文初稿。
分析的流程为:上传数据 -> 处理数据 -> 拆分训练集和验证集 -> 基线特征表 -> Lasso 回归筛选变量 -> 评价每个入选因子的 ROC 曲线 -> Logistic 建模 -> 绘制普通 nomogram -> 在训练集和验证集整体评价ROC -> 绘制 calibration 校准曲线 -> 绘制 DCA 曲线 -> 制作一个互动 nomogram 并部署到个人网站 -> AI 撰写论文
整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。
Nomogram,也叫作诺模图,是一种图形计算器,用于将数学公式或者复杂的统计模型转化为直观易用的图表。诺模图是一种强大的工具,可以用于可视化复杂模型的预测,通过滑动各变量标尺,就可以直观地得到预测结果,从而可以有效地为决策提供依据。在医学研究中,尤其是临床决策中,使用 nomogram 可以便捷地预测疾病的风险,评估治疗方案的效果等。
例如,在研究糖尿病发生的风险时,我们可以将年龄、性别、体重指数等危险因素作为预测变量,结合 Logistic 回归模型,制作出一个 nomogram。通过该 nomogram,我们可以快速直观地了解不同年龄、性别和体重指数下,糖尿病发生的风险大小。
对于如何在 MSTATA 中实现绘制 Logistic 回归的 nomogram,MSTATA 统计软件提供了丰富的功能支持,包括:
一键拆分训练集和验证集
一键生成基线特征表
一键完成 Logistic 建模
绘制经典 nomogram:MSTATA 不仅可以实现 Logistic 回归模型的构建和评估,还可以直接生成 nomogram,将复杂的模型转化为易于理解的图形,帮助用户直观地理解和解释模型结果。
绘制网页动态 nomogram:这是一个相对更加现代化的方式,用户可以在网页上交互式地操作 nomogram,调整预测变量的值,并直接看到预测结果的变化。这种方式可以使nomogram 更加动态,有助于更深入地理解模型。
一键部署到用户的个人网站:MSTATA 还提供了一键部署的功能,用户可以将自己制作的动态 nomogram 部署到自己的个人网站上,提供给其他人使用。而且,用户可以将自己部署nomogram 的网址附在论文里,使得读者能够更方便地使用 nomogram,增强论文的可读性和实用性。
一键完成 ROC 曲线
一键完成 Calibration 校准曲线
一键完成 DCA 曲线
一键完成 SCI 论文的撰写
综上所述,无论是经典的 nomogram 还是动态的 web 版 nomogram,都可以在 MSTATA 中轻松实现。这无疑使得 MSTATA 成为了一款强大的统计分析和可视化工具。
下面是使用方法:
步骤1:选择您的数据并加载到MSTATA。
上传数据后,如果有缺失数据,缺失值在20%以下的变量,可以酌情考虑做缺失值填补,这里首选随机森林法进行填补。缺失值20%-40%的变量,需要慎重考虑;缺失值40%以上的变量,建议不放入模型。
有两种数据模式,有外部验证集和没有外部验证集。
没有外部验证集,只有内部集时,请按照以下方式准备数据:
这里包括二分类的结局 Stroke Status (“Yes”, “No”), 以及多个预测因子。
如果既有内部集,又有外部验证集,请把两个集合在一起准备数据:
这里把内部集和外部集纵向合并起来,并增加一列在末尾,标示出那个是内部集,哪个是外部验证集。
后面分析的时候,系统会按要求将内部集拆分成训练集和内部验证集。然后以训练集、内部验证集、外部验证集三个队列来分别做基线人口学特征表。
步骤2:拆分数据集并生成基线表。
步骤3:lasso回归筛选变量
步骤4:对每个入选变量做单独 ROC 评价
步骤5:多因素建模
步骤6:绘制 nomogram
步骤7:对最终模型做 ROC 评价
步骤8:绘制calibration校准曲线
步骤9:绘制DCA曲线
步骤10:生成动态列线图并部署到个人网站
步骤10:下载word报告
步骤11:生成一篇 SCI 论文