用HRS数据库RAND数据分析,科研效率翻倍

文摘   2024-10-30 11:25   美国  

HRS变量太复杂,NA太多!

对于使用HRS数据库发文章的各位医学生们,最大的问题便是对各种变量的提取捉摸不清(So difficulty!)

另外因为HRS是一个追踪访问数据,因此会每一个新的wave增加新的受访者,也可能某个wave中之前受访者会缺席等等不确定因素。这就导致我们按照nhanes的逻辑处理数据会有点困难且不正确。

RAND数据--解决之道!

HRS由七个队列组成,RAND HRS纵向文件包含所有七个队列RAND文件将整个调查称为HRS,1992年首次采访的1931-41队列被标记为“初始”或“原始”HRS进入队列。

HRS官方发布的RAND数据是一个经过清理、处理和简化的变量集合。对不同的进行了合并连接,并且对一些常规变量进行处理,极其方便使用。下面是该数据库的一些常规变量,其中demographicshealthfunction limitations在医学领域相对使用较多。

RAND数据变量命名规则

除了少数例外,RAND HRS纵向文件中的变量名遵循一致的模式。
  • 第一个字符指示变量是指参考人(“R”)、配偶(“S”)还是家庭(“H”)。
  • 第二个字符指示变量所属的波:“1”、“2”、“3”...“15”、“A”或“E”。
    • “A”表示“全部”,即变量不特定于任何单个波。一个例子是RABDATE,受访者的出生日期。
    • “E”表示“退出”,于包含死后发生的退出访谈数据的变量。一个例子是REMSTAT,即被告死亡时的婚姻状况。

    举个例子,变量S2HLTHLM捕获参考人的配偶是否经历了限制她/他可以做的有偿工作的种类或数量的损伤或健康问题。变量的名称并不表明谁提供了信息。例如,配偶的健康问题可能是由配偶自己报告的,也可能是由参考人作为代理人报告的。HRS通过代理获得许多变量,特别是关于财务和家庭事务的变量。

通过这种方式,一方面可以提升数据分析速度另一方面发现NA数据量大幅下降,增加数据结果可信性。

另外,他们的RAND数据也是方便与charls等数据进行多国之间的比较

多数据库联合+环境联合

    本工作室特开发全网首发charlsMAX 包,专为方便CHARLS、CLHLS、CHNS、HRS、ELSA、SHARE、MHAS七大数据库清洗变量、数据分析打造;此外,R包中内置环境数据,可将多数据库与环境数据联合,缩短数据计算时间,高效分析,发文更快、更高水准。
功能介绍如下:
1R包直接调取变量数据-简简单单、干干净净。
2. 一款帮你写好代码的R包---直接复制运行,轻松计算二次变量!

3.  半小时学会生成基线表
4. 加更轨迹分析、筛选并构建最佳模型、可视化样样齐全!

5. 一键生成Kaplan-Meier曲线森林图-小白学习周期进一步缩短!

6. 配备了完备的数据检索网站,再也不用查手册啦:配备charlsMAX相关code、变量的查询网站轻松知道所需变量的wave/year、description、Code、Source等信息,具体功能介绍如下图。

此次更新如下:
  • 增加了codebook查询功能,目前支持CHARLS, CHNS, CLHLS, ELSA, MHAS, SHARE数据库。
  • 增加了数据预览功能,根据code预览对应原始数据(速度极快),便于大家理解数据的构成与内容,支持目前的7个数据库。



深夜答疑,24h并肩作战

charlsMAX R包如何购买?

  • 购买多国健康数据库精析与挖掘课程即送charlsMAX  R包,并配有常规学习代码、文章实操复现等视频学习内容(永久观看)

  • 另有服务:社群答疑(永久)、1v1选题 审稿 投稿推荐 返修指导服务(2年)

  • 价格:3999,学生3799(包含税,可开发票)


福利来咯!

    转发此条至朋友圈+配文字“医豌豆,科研精,公共数据库助你行”(维持3小时以上),即可免费获取“配有charlsMAX相关code、变量查询的网站”,并可加入公共数据库交流社群一起学习。


课程咨询微信

豌豆老师

小宇老师




课程购买链接


-END-

行稳致远 进而有为


期待你的

分享

点赞

在看

豌豆医学科研
擅长医学公共数据库挖掘及教学:NHANES、charls、KLoSA、HRS等
 最新文章