HRS变量太复杂,NA太多!
对于使用HRS数据库发文章的各位医学生们,最大的问题便是对各种变量的提取捉摸不清(So difficulty!)
另外因为HRS是一个追踪访问数据,因此会每一个新的wave增加新的受访者,也可能某个wave中之前受访者会缺席等等不确定因素。这就导致我们按照nhanes的逻辑处理数据会有点困难且不正确。
RAND数据--解决之道!
HRS由七个队列组成,RAND HRS纵向文件包含所有七个队列。RAND文件将整个调查称为HRS,1992年首次采访的1931-41队列被标记为“初始”或“原始”HRS进入队列。
HRS官方发布的RAND数据是一个经过清理、处理和简化的变量集合。对不同的进行了合并连接,并且对一些常规变量进行处理,极其方便使用。下面是该数据库的一些常规变量,其中demographics、health和function limitations在医学领域相对使用较多。
RAND数据变量命名规则
第一个字符指示变量是指参考人(“R”)、配偶(“S”)还是家庭(“H”)。 第二个字符指示变量所属的波:“1”、“2”、“3”...“15”、“A”或“E”。 “A”表示“全部”,即变量不特定于任何单个波。一个例子是RABDATE,受访者的出生日期。 “E”表示“退出”,于包含死后发生的退出访谈数据的变量。一个例子是REMSTAT,即被告死亡时的婚姻状况。
通过这种方式,一方面可以提升数据分析速度,另一方面发现NA数据量大幅下降,增加数据结果可信性。
另外,他们的RAND数据也是方便与charls等数据进行多国之间的比较。
多数据库联合+环境联合
5. 一键生成Kaplan-Meier曲线、森林图-小白学习周期进一步缩短!
增加了codebook查询功能,目前支持CHARLS, CHNS, CLHLS, ELSA, MHAS, SHARE数据库。 增加了数据预览功能,根据code预览对应原始数据(速度极快),便于大家理解数据的构成与内容,支持目前的7个数据库。
深夜答疑,24h并肩作战
charlsMAX R包如何购买?
购买多国健康数据库精析与挖掘课程即送charlsMAX R包,并配有常规学习代码、文章实操复现等视频学习内容(永久观看)
另有服务:社群答疑(永久)、1v1选题 审稿 投稿推荐 返修指导服务(2年)
价格:3999,学生3799(包含税,可开发票)
福利来咯!
转发此条至朋友圈+配文字“医豌豆,科研精,公共数据库助你行”(维持3小时以上),即可免费获取“配有charlsMAX相关code、变量查询的网站”,并可加入公共数据库交流社群一起学习。
课程咨询微信
豌豆老师
小宇老师
课程购买链接
行稳致远 进而有为
期待你的
分享
点赞
在看