ModelCube数据集 | WHO预期寿命数据集

文摘   2024-08-09 07:45   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

尽管在过去已经进行了大量研究,探讨了影响预期寿命的人口统计变量、收入构成和死亡率等因素。但研究发现,过去的研究中并未考虑疫苗接种和人类发展指数的影响。此外,一些过去的研究是基于一个国家的数据集,使用多元线性回归方法进行的。因此,这激励我们通过建立一个基于混合效应模型和多元线性回归的回归模型,并考虑2000年至2015年间所有国家的数据,来解决上述两个因素。重要疫苗接种,如乙肝、脊髓灰质炎和白喉也将被考虑。简而言之,这项研究将关注疫苗接种因素、死亡率因素、经济因素、社会因素以及其他健康相关因素。由于该数据集的观察结果基于不同的国家,这将使一个国家更容易确定导致预期寿命较低的预测因素。这将有助于建议一个国家应该重视哪些领域,以便更有效地提高其人口的预期寿命。

世界卫生组织(WHO)下的全球卫生观察所(GHO)数据存储库跟踪了所有国家的健康状况以及其他相关因素。这些数据集是为了健康数据分析的目的而向公众提供的。与193个国家相关的预期寿命和健康因素的数据集是从同一WHO数据存储库网站上收集的,而其相应的经济数据是从联合国网站上收集的。在所有健康相关因素的类别中,只选择了那些更具代表性的关键因素。观察到在过去15年中,卫生部门取得了巨大的发展,特别是在发展中国家,与过去30年相比,人类死亡率有所改善。因此,在这个项目中,我们考虑了2000年至2015年间193个国家的数据进行进一步分析。将单个数据文件合并为一个单一的数据集。数据集的初步视觉检查显示了一些缺失值。由于数据集来自WHO,我们没有发现明显的错误。使用R软件中的Missmap命令处理缺失数据。结果显示,大多数缺失数据是关于人口、乙肝和GDP的。这些缺失数据来自一些不太知名的国家,如瓦努阿图、汤加、多哥、佛得角等。找到这些国家的所有数据很困难,因此决定将这些国家排除在最终模型的数据集之外。最终合并的文件(最终数据集)包含22列和2938行,所有预测变量被分为几个大类:免疫相关因素、死亡率因素、经济因素和社会因素。

字段说明

字段名称字段说明
Country国家
Year年份
Status发达国家或发展中国家地位
Life expectancy特定年龄的预期寿命
Adult Mortality男性和女性成年人的死亡率(15至60岁之间每1000人口的死亡概率)
infant deaths每1000人口中的婴儿死亡数
Alcohol按人均记录的酒精消费量(15岁以上,纯酒精量以升计)
percentage expenditure人均国内生产总值中用于医疗保健的支出百分比(%)
Hepatitis B1岁儿童乙肝(HepB)疫苗接种覆盖率(%)
Measles麻疹 - 每1000人口中的报告病例数
BMI全体人口的平均体重指数
under-five deaths每 1000 人中五岁以下儿童死亡人数
Polio1 岁儿童脊髓灰质炎 (Pol3) 免疫覆盖率 (%)
Total expenditure一般政府卫生支出占政府总支出的百分比(%)
Diphtheria1岁儿童白喉破伤风类毒素和百日咳(DTP3)免疫覆盖率(%)
HIV/AIDS每 1 000 名活产婴儿的死亡人数 艾滋病毒/艾滋病(0-4 岁)
GDP人均国内生产总值(美元)
Population国家人口
thinness 1-19 years10至19岁儿童和青少年的瘦弱患病率(%)
thinness 5-9 years5至9岁儿童瘦弱发生率(%)
Income composition of resources资源收入构成方面的人类发展指数(指数范围从0到1)
Schooling受教育年限(年)

数据集的用途

  1. 研究最初选择的各种预测因素真的会影响预期寿命吗,实际影响预期寿命的预测变量是什么。

  2. 研究一个预期寿命值较低(<65)的国家是否应该增加医疗支出以提高其平均寿命。

  3. 研究婴儿和成人死亡率如何影响预期寿命。

  4. 研究预期寿命与饮食习惯、生活方式、锻炼、吸烟、饮酒等有正相关还是负相关。

  5. 研究学校教育对人类寿命的影响是什么。

  6. 研究预期寿命与饮酒是正相关还是负相关。

  7. 研究人口稠密的国家的预期寿命是否往往较低。

  8. 研究免疫覆盖率对预期寿命的影响是什么。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10087

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章