糖尿病数据分析和挖掘_企业调研_论文科研_毕业设计

文摘   健康   2024-09-08 14:10   重庆  

大家好,我是Toby老师,曾担任国内最大医药数据中心数据挖掘负责人。10年以上数据科学经验,和中科院,重科院,重庆中药研究所,重庆儿科医院教授有长期项目合作。现在成立了重庆未来之智信息技术咨询服务有限公司。我们公司的宗旨是用人工智能,数据科学挖掘疾病致病因子,提供疾病家庭预防和干预措施降低疾病患病率。人工智能让生活更美好!



糖尿病概述

糖尿病医学描述:糖尿病是一组因胰岛素绝对或相对分泌不足和(或)胰岛素利用障碍,引起的碳水化合物、蛋白质、脂肪代谢紊乱性疾病。以高血糖为主要标志。
糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻。

糖尿病最早记录可追述到古埃及。



中国黄帝内经也有类似糖尿病消渴症状的描述。

17世纪英国医生托马斯.威利斯记录了尿甜如蜜,这也是糖尿病的一个症状。


1889年,医学家发现,狗被切除胰腺后,患上了糖尿病。因此推断糖尿病和胰腺有关系。


1921年,加拿大医生班廷和生理学家贝斯特成功提取出了胰岛素,并证实了胰岛素可以降低血糖。大家为了纪念班廷医生,把他生日11月14日定为世界糖尿病日。


糖尿病主要分为四类:1型糖尿病2型糖尿病,妊娠期糖尿病,特殊类型糖尿病。


1型糖尿病是由于胰岛β细胞破坏、胰岛素绝对不足引起的一种糖尿病。

1型糖尿病患者占比小于5%。多于儿童和青少年起病,1型糖尿病患占比80-90%。1型糖尿病患者一般在20岁前发病。

2023年,1型糖尿病患者15万人左右。1型糖尿病患者大多无症状。


糖尿病临床症状主要体现为三多一少,即多饮,多食,多尿,体重减轻。细胞不能正常摄入葡萄糖,就会给大脑发出饥饿信号,增加饮食。但增加饮食后,葡萄糖仍然不能进入细胞,身体通过消耗自身脂肪来给细胞供应葡萄糖,因此出现消瘦。


糖尿病对全身危害较多,主要分类两类,对心血管破坏和细菌感染。


糖尿病会引起血管变窄,硬化或堵塞。长期供血不足,肝,脑,肾,眼睛都会发生病变。


糖尿病导致血管变硬。如果血管破裂出血后就会发生脑淤血,眼底出血等等。如果心脑血管堵塞就会发生心梗和脑梗。



下图是糖尿病视网膜病变和正常视力对比。


糖尿病引起感染包括皮肤感染,肺炎,泌尿系统感染。



全球糖尿病联盟公布数据显示2017年全球糖尿病患者4.26亿,2045年预计达到6.29亿。


2017年统计数据中,中国20-79岁糖尿病患者1.14亿,为全球最大糖尿病药品市场。


如果安装患病率统计,2019年估算中国糖尿病患病率排名世界第二 。


中国糖尿病患者数量为1.2亿,位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人属于糖尿病后备军,未来也将加入糖尿病市场,成为药企摇钱树。




下图为中国糖尿病患病率历史数据,我们看到从1980年到2010年,糖尿病患病率从不到1%增加到11.6%。


糖尿病发病率高,但诊治人数只有30%-40%左右,家庭生活方式干预更加不足。


糖尿病检查包括

体格检查

空腹血糖检测

随机血糖检测

口服葡萄糖耐量试验(金标准)

尿糖检测

糖化血红蛋白检测


糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。




糖尿病可预防

虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。

糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
我们目的就是通过建立人工智能机器学习模型,预测糖尿病概率和挖掘糖尿病重要致病因子。

糖尿病痛点

糖尿病科研有个痛点,就是临床医生经验很难用数据科学量化实验来辅助证明。而数据挖掘的结论也并非全部可信,需要和临床经验丰富医生交叉验证。

Toby老师从2011年就开始关注糖尿病问题。在这10年多时间,收集了上百个糖尿病数据集,包括不同国家糖尿病患者数据集,孕妇糖尿病数据集,糖尿病并发症数据集-糖尿病肾病数据集,糖尿病并发症数据集-糖尿病视网膜病变数据集,糖尿病遗传史数据集。Toby老师建立了几十个糖尿病预测模型,包括最先进深度学习算法。

通过对上GB大样本临床患者数据挖掘,发现糖尿病致病因子,并和临床经验结合解释数据挖掘结果合理性,为家庭疾病预防做出贡献。

我们的数据挖掘整合了多个糖尿病数据库,在国内也属于罕见,Toby老师提供了非常震撼的数据挖掘结果,大家可以点击收藏此文和分享给其他朋友,让更多朋友受益。

我们收集糖尿病相关变量数百个,全方位覆盖糖尿病相关风险点,主要包括

1.患者基础信息变量

年龄

性别

教育水平

收入水平

怀孕

血压

BMI指数

是否吸烟

最近30天是否有体育锻炼

水果摄入情况

蔬菜摄入情况

饮酒量

综合健康评级指数

心理健康分数,包括压力、抑郁和情绪问题

身体健康分数,在过去30天里有多少天处于身体疾病和受伤

走路或爬楼梯是否有严重困难


2.患者疾病史变量

高血压

高胆固醇

肺炎

肾炎

视网膜病变

中风

心脏病

是否免疫抑制

慢性阻塞性肺病

其他疾病

心血管疾病

哮喘

糖尿病家族史

糖尿病遗传系数

新冠病毒感染情况

插管



3.患者治疗相关变量

医疗开支情况

医疗保险情况

是否进过重症监护室

所在医院的医疗单位等级

在过去的一年内,有没有一次你需要看医生,但因为费用问题而不能看


4.糖尿病相关实验变量

口服耐糖量测试

胰岛素释放实验

血常规实验

尿常规实验


5.血尿常规检测相关变量

血糖

尿液白蛋白检查

尿白蛋白肌酐比

肾小球滤过率(GFR)

天门冬氨酸氨基转换酶

丙氨酸氨基转换酶

碱性磷酸酶

r-谷氨酰基转换酶

总蛋白

白蛋白

球蛋白

白球比例

甘油三酯

总胆固醇

高密度脂蛋白胆固醇

低密度脂蛋白胆固醇

尿素

肌酐

尿酸

乙肝表面抗原

乙肝表面抗体

乙肝e抗原

乙肝e抗体

乙肝核心抗体

白细胞计数

红细胞计数

血红蛋白

红细胞压积

红细胞平均体积

红细胞平均血红蛋白量

红细胞平均血红蛋白浓度

红细胞体积分布宽度

血小板计数

血小板平均体积

血小板体积分布宽度

血小板比积

中性粒细胞%

淋巴细胞%

单核细胞%

嗜酸细胞%

嗜碱细胞%


模型价值和意义

通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
1.模型能准确预测个人是否患有糖尿病。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人是否患有糖尿病。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。

5.我们通过建立AI图像识别模型,及时发现糖尿病视网膜病变患者。。

我们的模型具有良好区分能力,可准确预测患者糖尿病概率。

我们糖尿病预测模型可以预测单个就诊者糖尿病概率,也可批量预料成千上万名就诊者糖尿病概率。

计算机建模后可自动对数万糖尿病视网膜病变的识别。

我们还能对所有变量做相关性分析,挖掘互相关联的变量。比如高血压和肾病是否有高相关性?



相关课程

完整匹马印第安糖尿病风险预测模型代码和数据集在课程《python机器学习-糖尿病数据挖掘》下载。该课程有下属三个案例Python复现代码,建模糖尿病数据集,视频讲解,课后答疑群。

1.美国北卡罗来纳州立大学糖尿病血糖预测模型
2.Pima印第安人糖尿病风险预测模型
3.科大讯飞-糖尿病遗传风险检测挑战赛

欢迎商务合作

如果是糖尿病研究生,博士生论文,企业建模,可从下面课程选材料,并联系Toby老师,QQ:231469242,微信drug666123,QQ学习群:1026993837。




相关文章和视频

糖尿病数据独家震撼挖掘-基于上百万临床实验数(硬核,收藏)
AI糖尿病遗传风险检测模型-企业科研_论文毕设_专利
《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业科研
糖尿病视网膜病变预测模型-机器学习-人工智能
机器学习建模-糖尿病肾病预测模型

机器学习建模Pima印第安人糖尿病数据集-论文_企业科研

人工智能糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利


python生物信息学
python编程,生物,医药,疾病预测模型,机器学习,人工智能
 最新文章