健康新指标!如何利用CHARLS数据库计算体圆指数BRI

学术   2024-11-26 17:34   浙江  

在全球范围内,肥胖是一个非常重要的公共卫生问题。一般来说,肥胖是根据体重指数 (计算方法:体重除以身高的平方)来衡量的。大量研究表明,以体重指数定义的肥胖与全因死亡的高风险显著相关。但随着对身体成分的广泛调查,人们更加关注内脏肥胖与死亡率之间的关系。为了更好地体现脂肪分布,Thomas等人提出了一种新的人体测量指标--体圆指数(BRI),他们根据人体形状建立了椭圆模型来计算体圆,并利用偏心率来估算内脏脂肪和全身脂肪的百分比。除了体重和身高,BRI 还考虑了腰围,因此可以更全面地反映内脏脂肪分布。研究发现,BRI 在估计各种临床终点的风险方面优于其他人体测量指标。近期,JAMA 子刊上的一篇文章利用这个新的健康指标,考察了美国成年身体圆度指数 (BRI)的时间趋势及其与全因死亡率的关系。

基于这个新的健康指标,我们这里尝试CHARLS数据库计算下中国中老年人群的BRI情况,并尝试做一些回归分析。

gen bri = 364.2 - 365.5 * sqrt( 1 - (waist/(2*3.1415926))^2 /(0.5 * height)^2 )  if !mi(waist) & !mi(height)


计算后,BRI极端值很多,我们只保留0~10数值范围 

接着,我尝试用BRI做一些分析,大部分的结果都是显著的(主要控制年龄/性别/婚姻/户口/吸烟/饮酒/家庭经济状况/子女数量以及时间固定效应,采用稳健标准误)。

***BRI对高血压的影响
reg hibpe bri age gender marry edu hukou consume child smoke drink i.wave,r

Linear regression Number of obs = 26,454
F(12, 26441) = 226.30
Prob > F = 0.0000
R-squared = 0.0901
Root MSE = .42945

------------------------------------------------------------------------------
| Robust
hibpe | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .075574 .0020481 36.90 0.000 .0715597 .0795883
age | .0065089 .0003494 18.63 0.000 .0058239 .0071938
gender | .0544166 .0073485 7.41 0.000 .0400132 .06882
marry | .001673 .0015865 1.05 0.292 -.0014366 .0047826
edu | .0041728 .0029387 1.42 0.156 -.0015873 .0099328
hukou | -.0470098 .0076282 -6.16 0.000 -.0619615 -.032058
consume | 1.30e-07 1.27e-07 1.02 0.306 -1.19e-07 3.80e-07
child | .0025291 .0022991 1.10 0.271 -.0019772 .0070353
smoke | -.0236217 .007217 -3.27 0.001 -.0377673 -.0094761
drink | -.0303669 .0062293 -4.87 0.000 -.0425767 -.0181571
|
wave |
wave2 | -.0013845 .0066013 -0.21 0.834 -.0143234 .0115545
wave3 | .0497425 .0063573 7.82 0.000 .0372818 .0622032
|
_cons | -.4387015 .0235049 -18.66 0.000 -.4847724 -.3926306
------------------------------------------------------------------------------


***BRI对糖尿病的影响
reg diabe bri age gender marry edu hukou consume child smoke drink i.wave,r

Linear regression Number of obs = 26,335
F(12, 26322) = 59.18
Prob > F = 0.0000
R-squared = 0.0338
Root MSE = .25963

------------------------------------------------------------------------------
| Robust
diabe | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .0245607 .0013456 18.25 0.000 .0219232 .0271982
age | .0016984 .000202 8.41 0.000 .0013024 .0020943
gender | .0129868 .0045027 2.88 0.004 .0041612 .0218123
marry | -.0023521 .0009141 -2.57 0.010 -.0041438 -.0005605
edu | .0043788 .0018463 2.37 0.018 .0007599 .0079978
hukou | -.0420017 .0050609 -8.30 0.000 -.0519214 -.0320821
consume | 6.26e-08 6.62e-08 0.94 0.345 -6.73e-08 1.92e-07
child | -.0033128 .00132 -2.51 0.012 -.0059001 -.0007254
smoke | -.0121919 .0041846 -2.91 0.004 -.020394 -.0039899
drink | -.0228548 .0035582 -6.42 0.000 -.029829 -.0158805
|
wave |
wave2 | .0036909 .003904 0.95 0.344 -.0039611 .011343
wave3 | .0286421 .0039091 7.33 0.000 .02098 .0363041
|
_cons | -.1003531 .0140677 -7.13 0.000 -.1279266 -.0727796
------------------------------------------------------------------------------




***BRI对心脏病的影响
reg hearte bri age gender marry edu hukou consume child smoke drink i.wave,r

Linear regression Number of obs = 26,444
F(12, 26431) = 86.31
Prob > F = 0.0000
R-squared = 0.0434
Root MSE = .34328

------------------------------------------------------------------------------
| Robust
hearte | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
bri | .0232839 .0017469 13.33 0.000 .0198599 .0267078
age | .0035727 .0002816 12.69 0.000 .0030207 .0041248
gender | -.026618 .0059796 -4.45 0.000 -.0383383 -.0148977
marry | -.0000866 .001273 -0.07 0.946 -.0025817 .0024085
edu | .0150946 .0023744 6.36 0.000 .0104406 .0197485
hukou | -.0743137 .0064763 -11.47 0.000 -.0870075 -.0616198
consume | 3.07e-07 1.49e-07 2.06 0.039 1.50e-08 5.99e-07
child | .0035694 .0018421 1.94 0.053 -.0000412 .00718
smoke | -.0018787 .0058079 -0.32 0.746 -.0132626 .0095052
drink | -.0264769 .0048622 -5.45 0.000 -.0360071 -.0169468
|
wave |
wave2 | .0075221 .0051769 1.45 0.146 -.0026249 .0176692
wave3 | .0499333 .0051719 9.65 0.000 .0397961 .0600705
|
_cons | -.1488715 .0192513 -7.73 0.000 -.186605 -.1111379
------------------------------------------------------------------------------.

注意,我这里是为了简单省事,没有采用医学或者适合的方法。尽管 OLS 看似简单,但却是最实用的回归模型,基本能够说明一般现象。BRI可能与某些健康维度呈现U型关系,实际应用中,需要考虑不同分位数上的差异。上述是个人观点,可能存在错误,内容仅供参考。

CHARLS公布了第五期(2020)全国追访数据,引发了众多学者的浓厚兴趣,他们迫切希望利用这一新的CHARLS数据开展实证研究。然而,CHARLS数据库并非一套标准化的数据集,整体逻辑相对复杂。初学者刚接触,难免不太了解。还是会遇到不少问题:

  • CHARLS数据库里的数据变量非常多,利用什么程序进行数据清洗整理的?

  • 是否有易学且易操作的方法和软件推荐介绍呢?

  • CHARLS数据库里的缺失值、异常值如何处理呢?

  • 在处理CHARLS数据库前,是否有必要先筛选一下无效问卷?无效问卷是通过什么方式判断?


此外,数据清洗通常占据整个工作量的70~80%左右。为了尽可能减少公共数据库的使用门槛,加快初学者入门学术研究,我们希望建立一套标准化的 CHARLS数据集,以尽可能包含市面上的常用变量。



课程内容与安排

本次课程将以“中国健康与养老追踪调查(CHARLS)数据库”为例,帮助学员使用Stata完成CHARLS数据库的整理。本次课程分为四个单元,具体内容如下:


【上述课程内容为直播回放视频,已经全部完成】



名师授课

Shawn老师,毕业于西南财经大学,在健康经济学和应用计量经济学领域拥有丰富的研究经验,长期使用CHARLS数据库开展实证研究,对CHARLS数据库十分熟悉。Shawn老师团队主持了健康经济学专业公众号【丁点帮你】,撰写了CHARLS数据库专题文章,为经济学硕博讲过相关课程,专业水平也得到了粉丝的认可!




适用人群


公共卫生、医学、护理学、社会学、人口学、卫生经济学等领域,高校学者、青年教师、想发文章保研考研的本科生、广大在读的博士、硕士、面临晋升的临床医生等,Stata零基础的科研小白也完全OK!



课程优势

一、课程内容和质量

课程聚焦Charls数据库的清洗整理,注重细节处理,全程干货满满,学员评价极高,摘了几个学员评价:

“是我听过最好的CHARLS数据处理课程,很细节”

“之前清洗CFPS,对于如何合并为面板数据,始终不清楚,这次课程,终于懂了,解决了大问题”

“这个老师讲解的是真心不错,很实用”“这个老师讲的就相当可以,尤其是他整理的数据库,相当nice”

“我也学过很多课程,但在数据清洗方面,这个课程是最好的”

“第一次参与你们的课程,你们开发的课程,确实很用心,干货很多,课程很好!还真的出乎我的意料”


二、课程答疑

课程可以长期回放,并全程提供在线答疑,Shawn老师亲自长期沟通和答疑。同时,还有热心的群友帮忙,大家一起学习,问题很快能得到解决!被学员评价为售后最好的课程:

三、赠送清洗后的数据和代码(价值数百)

  • 每位学员还将收到包含2011年至2020年实证研究中常用变量(如年龄、性别、婚姻、教育程度、户籍、家庭收入、家庭消费、家庭规模、健在子女数量、吸烟、饮酒、身体活动、自评健康、14种慢性病、ADL、IADL、认知能力、情景记忆、心智状况、生活满意度、CESD-10、医疗保险、养老保险、代际支持等)的CHARLS数据和处理代码,供学员学习、模仿和修改使用。


  • 为了便于医学生使用,老师又招募了科研助理,对常用血检指标进行了清洗,包括:是否空腹白细胞平均红细胞体积血小板计数尿素氮血糖肌酐总胆固醇甘油三酯高密度脂蛋白胆固醇低密度脂蛋白胆固醇C反应蛋白糖化血红蛋白尿酸红细胞比容血红蛋白胱抑素C步行速度测试收缩压舒张压脉搏握力测试身高体重腰围甘油三酯葡萄糖指数(TyG指数)油三酯葡萄糖体重指数(TyG-BMI指数)


  • 最近一期更新的版本中,我们有增加了虚弱指数MetS代谢综合征 CircS昼夜节律综合症慢性病患病年份、是否死亡、死亡年份、肌少症、老年人跌倒等等!




  • (五轮共有96288条数据,包含221个常用变量,需要了解详细变量,请咨询客服,报名即发送数据和代码)


随着课程的不断完善开发,我们又陆续对清洗后的面板数据进行了更新,而且这种更新将会长期持续,力争做最好用的最全的Charls数据库,可以极大程度上减少大家清洗的工作量,比如:家庭总收入部分,如何计算第五轮 CHARLS 调查的家庭总收入,就是一个十分复杂的问题,Shawn老师花了10多个小时进行了测算,具体详见推文:

如何计算第五轮 CHARLS 调查的家庭总收入 


我们团队选择部分变量进行统一清洗以后供大家使用,同时,如果对某个变量有歧义的,也可以私信老师。


最后,郑重申明:希望大家支持正版!有很多变量的清洗逻辑不是仅看代码就可以搞清楚的,我们会提供详细的答疑!


四、课程微信群的使用

我们目前的课程群共有600多人,课程群除了Shawn老师答疑以外,大家平时会讨论Charls数据库相关问题,且不局限于数据库清洗,也包含后期实证分析,也会分享一些文献,大家相互交流,对学习非常有用。


【注意】原始数据请从CHARLS官网申请获取:

http://charls.pku.edu.cn


课程价格

  • 原价899,毕业论文季,优惠价499元

  • 购买前可以咨询助教,可开技术服务费、培训费、咨询费等发票;可出具课程培训通知,方便报销。

助教二维码,联系咨询

购课二维码,直接购买


学术严选
致力于学术资源创作、搬运、遴选,提供高质量的学术资源下载
 最新文章