近年来,中国健康与养老追踪调查(CHARLS)数据在健康、老龄化和社会经济研究领域获得了广泛关注。为了更便捷地支持全球研究人员分析,CHARLS官方提供了“Harmonised”数据集。这是一组经过预处理和标准化的数据,适合用于纵向分析并便于与国际上其他老年健康数据库(如HRS、ELSA)进行比较。今天我们就来介绍如何高效使用CHARLS的Harmonised数据,帮助大家在研究上事半功倍!
一、什么是Harmonised数据?
Harmonised数据是对CHARLS原始数据经过清洗、转码、变量选择和重新编码的版本。它提供了标准化的变量定义和格式,使研究人员可以轻松对接HRS(美国健康与退休研究)和ELSA(英国老龄化纵向研究)等其他国际数据库。这种一致性设计允许不同国家的研究者直接进行跨国比较分析。
另外咱常规的一些变量使用harmonised数据计算更为准确方便,NA更少。例如:年龄、教育程度、婚姻状态、BMI、慢病数量、CESD评分等。
二、如何获取Harmonised数据?
(1)前往官方网站:访问中国健康与养老追踪调查(CHARLS)网站 https://charls.pku.edu.cn/,注册并下载Harmonised数据。
下载数据手册:在下载数据的同时,务必下载CHARLS Harmonised数据的详细手册(Codebook),了解每个变量的定义和处理方式。
三、Harmonised数据的基本变量
Harmonised数据集整理了诸多生活健康相关的变量,主要包括以下几类:
人口学信息:年龄、性别、教育水平、婚姻状况等。
经济状况:收入、家庭年度支出、财产等。
健康状况:包括生理指标(如BMI、血压、腰围、握力、肺功能)、14种慢性病(如高血压、糖尿病)和生活行为(如吸烟、饮酒)等。
日常活动:包括日常生活活动(ADL)和工具性日常生活活动(IADL),用于评估老年人的生活自理能力。
认知功能:即时记忆、延迟记忆和心理完整性、CESD评分等认知指标,帮助分析认知功能随时间的变化。
(1)以cesd评分为例。rxcesd10代表了wave 1-wave4的个体cesd评分。r代表受访者,s代表受访者的配偶。x代表了哪个wave。后面cesd10代表这个变量的描述简写。更具体内容可以在下面How Constructed部分查看。
(2)我们将r1cesd10复制到我们的charlsMAX网站检索,获取对应code,一方面可以直接导入R,另一方面可以预览该变量具体内容。
五、Harmonised数据的注意事项
(1)harmonised数据目前包含wave1-wave4,不包含2020wave数据。
(2)不包含血检数据。对于血检数据的提取可以直接用原始数据提取,也很简单,然后再通过id与harmonised数据合并。
(3)建议以harmonised数据为主清洗数据,然后harmonised里面没有的变量,再用原始数据做。简单且准确。
(4)HRS、ELSA等数据库的与charls的harmonised数据以及相关codebook如出一辙,使用方法一致。
——————————————————————————————
多数据库联合+环境联合
5. 一键生成Kaplan-Meier曲线、森林图-小白学习周期进一步缩短!
增加了codebook查询功能,目前支持CHARLS, CHNS, CLHLS, ELSA, MHAS, SHARE数据库。 增加了数据预览功能,根据code预览对应原始数据(速度极快),便于大家理解数据的构成与内容,支持目前的7个数据库。
深夜答疑,24h并肩作战
charlsMAX R包如何购买?
购买多国健康数据库精析与挖掘课程即送charlsMAX R包,并配有常规学习代码、文章实操复现等视频学习内容(永久观看)
另有服务:社群答疑(永久)、1v1选题 审稿 投稿推荐 返修指导服务(2年)
价格:3999,学生3799(包含税,可开发票)
福利来咯!
转发此条至朋友圈+配文字“医豌豆,科研精,公共数据库助你行”(维持3小时以上),即可免费获取“配有charlsMAX相关code、变量查询的网站”,并可加入公共数据库交流社群一起学习。
课程咨询微信
豌豆老师
小宇老师
课程购买链接
行稳致远 进而有为
期待你的
分享
点赞
在看