GPT终于可以根据用户自己上传的临床数据一键生成可投稿级的SCI 论文了

文摘   科学   2023-08-13 18:00   上海  


本文介绍了利用MSTATA软件,上传数据后,一键完成Logistic - nomogram(列线图)的临床预测研究分析,并自动生成一篇 30 多页的 SCI 论文初稿。整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。论文共3000 余字,经过简单人工处理后即可投稿。

众所周知,chatGPT可以撰写一些论文的片段,但根据用户自己的数据生成统计图表,并且撰写全文,对于chatGPT来说,目前还很困难,出来的文章质量很糟糕,错漏百出,更别说到发表级了。


目前如果需要让人工智能根据用户自己的数据,秒出论文并达到发表级,只有www.mstata.com 能够做到。

这里我们以目前很热门的 Logsitic - nomogram 临床预测研究为例,看看Mstata是如何自动生成发表级论文的:


请到下面的网址体验一键生成 SCI 论文的乐趣:


进入www.mstata.com 左侧选MSTATA>按照研究类型分类>传统预测研究>Logistic - nomogram 预测研究开始


工具能够一键完成Logistic - nomogram(列线图)的临床预测研究分析,并自动生成一篇 30 多页的 SCI论文初稿。


分析的流程为:上传数据 -> 处理数据 -> 拆分训练集和验证集 -> 基线特征表 -> Lasso 回归筛选变量 -> 评价每个入选因子的 ROC 曲线 -> Logistic 建模 -> 绘制普通 nomogram -> 在训练集和验证集整体评价ROC -> 绘制 calibration 校准曲线 -> 绘制 DCA 曲线 -> 制作一个互动 nomogram 并部署到个人网站 -> AI 撰写论文

整个过程视网络速度情况,从上传数据到论文生成,约5-8分钟完成,点击鼠标20次左右。


Nomogram,也叫作诺模图,是一种图形计算器,用于将数学公式或者复杂的统计模型转化为直观易用的图表。诺模图是一种强大的工具,可以用于可视化复杂模型的预测,通过滑动各变量标尺,就可以直观地得到预测结果,从而可以有效地为决策提供依据。在医学研究中,尤其是临床决策中,使用 nomogram 可以便捷地预测疾病的风险,评估治疗方案的效果等。

例如,在研究糖尿病发生的风险时,我们可以将年龄、性别、体重指数等危险因素作为预测变量,结合 Logistic 回归模型,制作出一个 nomogram。通过该 nomogram,我们可以快速直观地了解不同年龄、性别和体重指数下,糖尿病发生的风险大小。

对于如何在 MSTATA 中实现绘制 Logistic 回归的 nomogram,MSTATA 统计软件提供了丰富的功能支持,包括:

  1. 一键拆分训练集和验证集

  2. 一键生成基线特征表

  3. 一键完成 Logistic 建模

  4. 绘制经典 nomogram:MSTATA 不仅可以实现 Logistic 回归模型的构建和评估,还可以直接生成 nomogram,将复杂的模型转化为易于理解的图形,帮助用户直观地理解和解释模型结果。

  5. 绘制网页动态 nomogram:这是一个相对更加现代化的方式,用户可以在网页上交互式地操作 nomogram,调整预测变量的值,并直接看到预测结果的变化。这种方式可以使nomogram 更加动态,有助于更深入地理解模型。

  6. 一键部署到用户的个人网站:MSTATA 还提供了一键部署的功能,用户可以将自己制作的动态 nomogram 部署到自己的个人网站上,提供给其他人使用。而且,用户可以将自己部署nomogram 的网址附在论文里,使得读者能够更方便地使用 nomogram,增强论文的可读性和实用性。

  7. 一键完成 ROC 曲线

  8. 一键完成 Calibration 校准曲线

  9. 一键完成 DCA 曲线

  10. 一键完成 SCI 论文的撰写

综上所述,无论是经典的 nomogram 还是动态的 web 版 nomogram,都可以在 MSTATA 中轻松实现。这无疑使得 MSTATA 成为了一款强大的统计分析和可视化工具。

下面是使用方法:

步骤1:选择您的数据并加载到MSTATA。

上传数据后,如果有缺失数据,缺失值在20%以下的变量,可以酌情考虑做缺失值填补,这里首选随机森林法进行填补。缺失值20%-40%的变量,需要慎重考虑;缺失值40%以上的变量,建议不放入模型。

有两种数据模式,有外部验证集和没有外部验证集。

没有外部验证集,只有内部集时,请按照以下方式准备数据:

这里包括二分类的结局 Stroke Status (“Yes”, “No”), 以及多个预测因子。

如果既有内部集,又有外部验证集,请把两个集合在一起准备数据:

这里把内部集和外部集纵向合并起来,并增加一列在末尾,标示出那个是内部集,哪个是外部验证集。

后面分析的时候,系统会按要求将内部集拆分成训练集和内部验证集。然后以训练集、内部验证集、外部验证集三个队列来分别做基线人口学特征表。

步骤2:拆分数据集并生成基线表。

步骤3:lasso回归筛选变量

步骤4:对每个入选变量做单独 ROC 评价

步骤5:多因素建模

步骤6:绘制 nomogram

步骤7:对最终模型做 ROC 评价

步骤8:绘制calibration校准曲线

步骤9:绘制DCA曲线

步骤10:生成动态列线图并部署到个人网站

步骤10:下载word报告

步骤11:生成一篇 SCI 论文

真实世界数据
介绍真实世界数据,真实世界研究和真实世界证据
 最新文章