在全球范围内,肥胖是一个非常重要的公共卫生问题。一般来说,肥胖是根据体重指数 (计算方法:体重除以身高的平方)来衡量的。大量研究表明,以体重指数定义的肥胖与全因死亡的高风险显著相关。但随着对身体成分的广泛调查,人们更加关注内脏肥胖与死亡率之间的关系。为了更好地体现脂肪分布,Thomas等人提出了一种新的人体测量指标--体圆指数(BRI),他们根据人体形状建立了椭圆模型来计算体圆,并利用偏心率来估算内脏脂肪和全身脂肪的百分比。除了体重和身高,BRI 还考虑了腰围,因此可以更全面地反映内脏脂肪分布。研究发现,BRI 在估计各种临床终点的风险方面优于其他人体测量指标。近期,JAMA 子刊上的一篇文章利用这个新的健康指标,考察了美国成年身体圆度指数 (BRI)的时间趋势及其与全因死亡率的关系。
基于这个新的健康指标,我们这里尝试CHARLS数据库计算下中国中老年人群的BRI情况,并尝试做一些回归分析。
gen bri = 364.2 - 365.5 * sqrt( 1 - (waist/(2*3.1415926))^2 /(0.5 * height)^2 ) if !mi(waist) & !mi(height)
计算后,BRI极端值很多,我们只保留0~10数值范围的。
接着,我尝试用BRI做一些分析,大部分的结果都是显著的(主要控制年龄/性别/婚姻/户口/吸烟/饮酒/家庭经济状况/子女数量以及时间固定效应,采用稳健标准误)。
***BRI对高血压的影响
reg hibpe bri age gender marry edu hukou consume child smoke drink i.wave,r
Linear regression Number of obs = 26,454
F(12, 26441) = 226.30
Prob > F = 0.0000
R-squared = 0.0901
Root MSE = .42945
------------------------------------------------------------------------------
| Robust
hibpe | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .075574 .0020481 36.90 0.000 .0715597 .0795883
age | .0065089 .0003494 18.63 0.000 .0058239 .0071938
gender | .0544166 .0073485 7.41 0.000 .0400132 .06882
marry | .001673 .0015865 1.05 0.292 -.0014366 .0047826
edu | .0041728 .0029387 1.42 0.156 -.0015873 .0099328
hukou | -.0470098 .0076282 -6.16 0.000 -.0619615 -.032058
consume | 1.30e-07 1.27e-07 1.02 0.306 -1.19e-07 3.80e-07
child | .0025291 .0022991 1.10 0.271 -.0019772 .0070353
smoke | -.0236217 .007217 -3.27 0.001 -.0377673 -.0094761
drink | -.0303669 .0062293 -4.87 0.000 -.0425767 -.0181571
|
wave |
wave2 | -.0013845 .0066013 -0.21 0.834 -.0143234 .0115545
wave3 | .0497425 .0063573 7.82 0.000 .0372818 .0622032
|
_cons | -.4387015 .0235049 -18.66 0.000 -.4847724 -.3926306
------------------------------------------------------------------------------
***BRI对糖尿病的影响
reg diabe bri age gender marry edu hukou consume child smoke drink i.wave,r
Linear regression Number of obs = 26,335
F(12, 26322) = 59.18
Prob > F = 0.0000
R-squared = 0.0338
Root MSE = .25963
------------------------------------------------------------------------------
| Robust
diabe | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .0245607 .0013456 18.25 0.000 .0219232 .0271982
age | .0016984 .000202 8.41 0.000 .0013024 .0020943
gender | .0129868 .0045027 2.88 0.004 .0041612 .0218123
marry | -.0023521 .0009141 -2.57 0.010 -.0041438 -.0005605
edu | .0043788 .0018463 2.37 0.018 .0007599 .0079978
hukou | -.0420017 .0050609 -8.30 0.000 -.0519214 -.0320821
consume | 6.26e-08 6.62e-08 0.94 0.345 -6.73e-08 1.92e-07
child | -.0033128 .00132 -2.51 0.012 -.0059001 -.0007254
smoke | -.0121919 .0041846 -2.91 0.004 -.020394 -.0039899
drink | -.0228548 .0035582 -6.42 0.000 -.029829 -.0158805
|
wave |
wave2 | .0036909 .003904 0.95 0.344 -.0039611 .011343
wave3 | .0286421 .0039091 7.33 0.000 .02098 .0363041
|
_cons | -.1003531 .0140677 -7.13 0.000 -.1279266 -.0727796
------------------------------------------------------------------------------
***BRI对心脏病的影响
reg hearte bri age gender marry edu hukou consume child smoke drink i.wave,r
Linear regression Number of obs = 26,444
F(12, 26431) = 86.31
Prob > F = 0.0000
R-squared = 0.0434
Root MSE = .34328
------------------------------------------------------------------------------
| Robust
hearte | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .0232839 .0017469 13.33 0.000 .0198599 .0267078
age | .0035727 .0002816 12.69 0.000 .0030207 .0041248
gender | -.026618 .0059796 -4.45 0.000 -.0383383 -.0148977
marry | -.0000866 .001273 -0.07 0.946 -.0025817 .0024085
edu | .0150946 .0023744 6.36 0.000 .0104406 .0197485
hukou | -.0743137 .0064763 -11.47 0.000 -.0870075 -.0616198
consume | 3.07e-07 1.49e-07 2.06 0.039 1.50e-08 5.99e-07
child | .0035694 .0018421 1.94 0.053 -.0000412 .00718
smoke | -.0018787 .0058079 -0.32 0.746 -.0132626 .0095052
drink | -.0264769 .0048622 -5.45 0.000 -.0360071 -.0169468
|
wave |
wave2 | .0075221 .0051769 1.45 0.146 -.0026249 .0176692
wave3 | .0499333 .0051719 9.65 0.000 .0397961 .0600705
|
_cons | -.1488715 .0192513 -7.73 0.000 -.186605 -.1111379
------------------------------------------------------------------------------.
注意,我这里是为了简单省事,没有采用医学或者适合的方法。尽管 OLS 看似简单,但却是最实用的回归模型,基本能够说明一般现象。BRI可能与某些健康维度呈现U型关系,实际应用中,需要考虑不同分位数上的差异。上述是个人观点,可能存在错误,内容仅供参考。
CHARLS公布了第五期(2020)全国追访数据,引发了众多学者的浓厚兴趣,他们迫切希望利用这一新的CHARLS数据开展实证研究。然而,CHARLS数据库并非一套标准化的数据集,整体逻辑相对复杂。初学者刚接触,难免不太了解。还是会遇到不少问题:
CHARLS数据库里的数据变量非常多,利用什么程序进行数据清洗整理的?
是否有易学且易操作的方法和软件推荐介绍呢?
CHARLS数据库里的缺失值、异常值如何处理呢?
在处理CHARLS数据库前,是否有必要先筛选一下无效问卷?无效问卷是通过什么方式判断?
此外,数据清洗通常占据整个工作量的70~80%左右。为了尽可能减少公共数据库的使用门槛,加快初学者入门学术研究,我们希望建立一套标准化的 CHARLS数据集,以尽可能包含市面上的常用变量。
课程内容与安排
本次课程将以“中国健康与养老追踪调查(CHARLS)数据库”为例,帮助学员使用Stata完成CHARLS数据库的整理。本次课程分为四个单元,具体内容如下:
【上述课程内容为直播回放视频,已经全部完成】
名师授课
Shawn老师,毕业于西南财经大学,在健康经济学和应用计量经济学领域拥有丰富的研究经验,长期使用CHARLS数据库开展实证研究,对CHARLS数据库十分熟悉。Shawn老师团队主持了健康经济学专业公众号【丁点帮你】,撰写了CHARLS数据库专题文章,为经济学硕博讲过相关课程,专业水平也得到了粉丝的认可!
适用人群
公共卫生、医学、护理学、社会学、人口学、卫生经济学等领域,高校学者、青年教师、想发文章保研考研的本科生、广大在读的博士、硕士、面临晋升的临床医生等,Stata零基础的科研小白也完全OK!
课程优势
一、课程内容和质量
课程聚焦Charls数据库的清洗整理,注重细节处理,全程干货满满,学员评价极高,摘了几个学员评价:
“是我听过最好的CHARLS数据处理课程,很细节”
“之前清洗CFPS,对于如何合并为面板数据,始终不清楚,这次课程,终于懂了,解决了大问题”
“这个老师讲解的是真心不错,很实用”“这个老师讲的就相当可以,尤其是他整理的数据库,相当nice”
“我也学过很多课程,但在数据清洗方面,这个课程是最好的”
“第一次参与你们的课程,你们开发的课程,确实很用心,干货很多,课程很好!还真的出乎我的意料”
二、课程答疑
课程可以长期回放,并全程提供在线答疑,Shawn老师亲自长期沟通和答疑。同时,还有热心的群友帮忙,大家一起学习,问题很快能得到解决!被学员评价为售后最好的课程:
三、赠送清洗后的数据和代码(价值数百)
每位学员还将收到包含2011年至2020年实证研究中常用变量(如年龄、性别、婚姻、教育程度、户籍、家庭收入、家庭消费、家庭规模、健在子女数量、吸烟、饮酒、身体活动、自评健康、14种慢性病、ADL、IADL、认知能力、情景记忆、心智状况、生活满意度、CESD-10、医疗保险、养老保险、代际支持等)的CHARLS数据和处理代码,供学员学习、模仿和修改使用。
为了便于医学生使用,老师又招募了科研助理,对常用血检指标进行了清洗,包括:是否空腹、白细胞、平均红细胞体积、血小板计数、尿素氮、血糖、肌酐、总胆固醇、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、C反应蛋白、糖化血红蛋白、尿酸、红细胞比容、血红蛋白、胱抑素C、步行速度测试、收缩压、舒张压、脉搏、握力测试、身高、体重、腰围、甘油三酯葡萄糖指数(TyG指数)、油三酯葡萄糖体重指数(TyG-BMI指数)
最近一期更新的版本中,我们有增加了虚弱指数、MetS代谢综合征 CircS昼夜节律综合症、慢性病患病年份、是否死亡、死亡年份、肌少症、老年人跌倒等等!
(五轮共有96288条数据,包含221个常用变量,需要了解详细变量,请咨询客服,报名即发送数据和代码)
随着课程的不断完善开发,我们又陆续对清洗后的面板数据进行了更新,而且这种更新将会长期持续,力争做最好用的最全的Charls数据库,可以极大程度上减少大家清洗的工作量,比如:家庭总收入部分,如何计算第五轮 CHARLS 调查的家庭总收入,就是一个十分复杂的问题,Shawn老师花了10多个小时进行了测算,具体详见推文:
我们团队选择部分变量进行统一清洗以后供大家使用,同时,如果对某个变量有歧义的,也可以私信老师。
最后,郑重申明:希望大家支持正版!有很多变量的清洗逻辑不是仅看代码就可以搞清楚的,我们会提供详细的答疑!
四、课程微信群的使用
我们目前的课程群共有600多人,课程群除了Shawn老师答疑以外,大家平时会讨论Charls数据库相关问题,且不局限于数据库清洗,也包含后期实证分析,也会分享一些文献,大家相互交流,对学习非常有用。
【注意】原始数据请从CHARLS官网申请获取:
http://charls.pku.edu.cn
课程价格
原价899,毕业论文季,优惠价499元
购买前可以咨询助教,可开技术服务费、培训费、咨询费等发票;可出具课程培训通知,方便报销。
助教二维码,联系咨询 | 购课二维码,直接购买 |