全网首发，一键多重填补缺失值与合成数据-SPSS篇｜转载

学术 2024-08-31 18:05 广东

最近两天，陆陆续续有人问我缺失值怎么多重填补(Multiple Imputation, MI)？SPSS填补后到底该用哪个数据集？

缺失值是个很大的话题，方法很多内容更加庞杂，方法多的同时就意味着并没有完全形成统一的公认标准，同理类似方差分析两两比较。本文从SCI中最高频的多重填补方法进行案例展示，并用SPSS来完成缺失值多重填补及后续数据集的生成。

SPSS多重插补很多人都会第一步，网上各种教程也是停留在这一步，但是生成了5次插补数据后续该如何继续下去？全网都没有关于SPSS的后续操作教程。小编本文掏出珍藏了5年的家底，又重新逐步添加上说明文字，让本文既有菜单又有代码实现一键MI数据。是不是看到这里，你捡到宝了。

一、 SPSS多重填补菜单操作

1.1原始数据。

MIsample.sav数据为笔者若干年前data，随机抽取20人，重在展示如何一步步MI。原始数据如下。

1.2 MI填补分析模式

选择多重插补分析模式，进行缺失值的探索,将需要探索缺失值的变量选择进入分析各个变量框内，点击确定。提示总体缺失情况，5个变量中有4个变量均有不同程度的缺失。

1.3 插补缺失数据

将变量选入右侧变量框中，插补次数默认为5次，也就是最终生成5个插补后数据集，并命名为new，点击确定。这个时候，你会发现新生成的数据集，并且在右侧上角出现一个下拉框可以选择原始数据或者生成的5个插补数据进行分析了。MI选择的时候要注意，纳入一列无缺失的变量，这样可防止最后填补后依旧是不完全数据。

此时，在SPSS中生成5套数据后怎么进行分析呢，有三种后续操作。

“
① 偷懒。直接选择填补Imputation_ =1 或2~5的某单次数据集进行操作。
② 可以把5套MI数据各模型做一遍，然后比较效应量择优选表现最好的某次，例如Imputation_ =1。
③ 推荐！考虑5次平均效应，将5次MI取平均值或中位数，优化为单独一次的新MI数据，再进行后续分析。本文着重介绍的是③法。
”

1.4. OMS操作

1)1.1-1.3为SPSS中执行的经典MI操作并获得多重插补文件。2）选择并删除原始数据行，即删除Imputation_=0。3）按“ID”和“插补次数”对多重插补文件进行排序 4)激活OMS并：a）选择表（输出类型）b）选择频率（命令标识符）c）选择统计信息（表子类型…） d）保存为新的数据集（给予它一个名字）e）在选项中选择“所有维度一行”f）选择“从查看器中排除”g）点击“添加”按钮（在屏幕的右中）并点击确定两次以完成。此时已经生成了一个活动的“批处理OMS”文件，相当于监控你后续操作，有frequency操作的时候就激活。5）返回到您的多重估算文件，并按“ID”选择“按组组织输出”将其拆分。6）然后在“分析”选项卡中选择“频率”，并选择平均数、中位数和众数。7）返回“实用程序”选项卡，选择“OMS控制面板”，然后单击屏幕右上角的“全部结束”选项卡。

此时会生成一个新的数据文件single，每个病例有一个条目，每个变量相应地汇总为一个平均值或众数。最后保留中位数或均数(连续变量)或众数(分类变量)的MI填补数据，再复制原始MIsample.sav变量视图的属性覆盖single数据的属性。

4.SPSS代码操作

如果你看上面的过程很繁琐，只需要更改下列SPSS 语法中红色部分变量名即可，一键完成上述菜单操作。最大最小值要手动输入。

5. 小结

一键多重填补.sps，一键自动生成填补5次后最优单个数据集，还不用起来吗？

http://mp.weixin.qq.com/s?__biz=MzU2Mzk2NTU5MA==&mid=2247490405&idx=1&sn=d771da9bc3960227aecc073e9388af13

251的学术清单

芝士就是力量。

最新文章

写好论文局限性只需这3步！｜写作

史上最强SCI配色R包，自动美图简单易用

全网首发，一键多重填补缺失值与合成数据-SPSS篇｜转载

数据异常值，肿么办，要不要删除呢？｜转载

祝贺又一同学见刊SCI：基于多实例学习的人工智能模型辅助声带白斑诊断：一项多中心诊断研究

顶刊table1基线表全网最强R包评测，横空出世的中文期刊专属table1sci包

学术写作注意事项——格式问题

适合研究生的科研步骤和技巧

一个丝滑转换不同效应值的在线工具｜荟萃分析

画张精美的医学研究机制图，你需要这个素材库！

一款免费的在线样本量计算器｜powerandsamplesize

效率科研干货合集｜汇总

一款免费的在线样本量计算器

受奥斯卡提名电影启发的 10 款调色板

临床研究中报告性别是用 gender 还是 sex？

效率科研干货合集｜汇总

R 进行荟萃分析的实践指南

开箱即用的AI思维导图工具——AmyMind|效率工具

期刊推荐使用的论文润色究竟是什么｜科研新手指南

如果只能给你介绍一款思维导图工具，会是——

10分钟口头汇报的PPT设计要点——学术会议必备技能

分享｜32 份 R 语言文档沟通推文汇总

高效绘制流程图的简易工具，pick这款也可以 | draw.io

上海交大医学教授：预后研究设计要素与分析方法

遇到 SciHub 下载不了的文献？不妨试试这2个网站！

文章返修了！审稿人意见怎么回复？

效率科研干货合集｜汇总

投稿了！学术论文如何选择合适的期刊？

Cover letter 怎么写｜SCI 投稿

PubMed 数据库简介及检索策略

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉