大家好,我是Toby老师,曾担任国内最大医药数据中心数据挖掘负责人。10年以上数据科学经验,和中科院,重科院,重庆中药研究所,重庆儿科医院教授有长期项目合作。现在成立了重庆未来之智信息技术咨询服务有限公司。我们公司的宗旨是用人工智能,数据科学挖掘疾病致病因子,提供疾病家庭预防和干预措施降低疾病患病率。人工智能让生活更美好!
科大讯飞-糖尿病遗传风险检测挑战赛
今天复现的案例是科大讯飞-糖尿病遗传风险检测挑战赛,官网截图如下。这个糖尿病项目时间比较新,是2023年6月份数据,是用于论文发表的优秀选材。
糖尿病建模数据集介绍
此次临床试验数据总人数5000左右,其中糖尿病患者1936人,占比38.7%,变量9个。
BMI指数:体重除以身高的平方,单位kg/m2;
糖尿病家族史:标识糖尿病的遗传特性,记录家族里面患有糖尿病的家属,分成三种标识,分别是父母有一方患有糖尿病、叔叔或者姑姑有一方患有糖尿病、无记录;
舒张压:心脏舒张时,动脉血管弹性回缩时,产生的压力称为舒张压,单位mmHg;
口服耐糖量测试:诊断糖尿病的一种实验室检查方法。数据采用120分钟耐糖测试后的血糖值,单位mmol/L;
胰岛素释放实验:空腹时定量口服葡萄糖刺激胰岛β细胞释放胰岛素。数据采用服糖后120分钟的血浆胰岛素水平,单位pmol/L;
肱三头肌皮褶厚度:在右上臂后面肩峰与鹰嘴连线的重点处,夹取与上肢长轴平行的皮褶,纵向测量,单位mm;
target为患有糖尿病标识:数据标签,1表示患有糖尿病,0表示未患有糖尿病。
Toby老师通过建立模型,喂养模型数据,让模型像人类一样学习数据,学会区分糖尿病能力。
模型学习完毕后,Toby老师验证模型质量,如下图,模型各个指标都非常优秀。这几乎是个完美的糖尿病预测模型。
接下来,我们分析哪些变量是导致糖尿病的高位因子。如下图BMI指数是最重要的糖尿病因子,其次是肱三头肌皮褶厚度。胰岛素释放实验,口服耐糖量测试,血压也是糖尿病相关因子。性别和糖尿病家族史看起来不像糖尿病重要因子。
如下图,Toby老师通过数据统计,发现糖尿病和糖尿病家族史没有显著相关性。
适当锻炼,合理饮食,可以让身体保持正常BMI指数,身体更年期,延缓衰老。我国唐代医药学家孙思邈曾言:“养生之道,常欲小劳,但莫大疲,及强所不能耳,且流水不腐,户枢不蠹,以其运动故也。”孙思邈把如何运动的细节和精髓都说透了。
孙思邈的话戳中了现代人的痛点,久坐,运动量减少,肥胖,然后是糖尿病患者越来越多。让我们适当合理运动,对糖尿病说bye bye!
三头肌皮褶厚度(triceps skinfold thickness)
肩峰和尺骨鹰嘴连线的上臂中点上1cm处的皮下脂肪厚度。是人体测量的一个指标。不能准确反映总体脂肪量。
非糖尿病患者的三头肌皮褶厚度平均值是2.588,糖尿病患者的三头肌皮褶厚度平均值是14.126 。两组数据在统计学上有显著差异。因此三头肌皮褶厚度和糖尿病有紧密相关性。Toby老师通过统计发现肱三头肌皮褶厚度和糖尿病有0.3的相关性,在医药领域,这是一个重要因子。
舒张压和糖尿病关系之前文章已经描述过,这里不重复描述。此数据集里舒张压是一个中等强度的变量。
口服耐糖量测试OGTT
诊断糖尿病的一种实验室检查方法。数据采用120分钟耐糖测试后的血糖值,单位mmol/L。
Toby老师统计非糖尿病患者的口服耐糖量测试平均值:5.66,
糖尿病患者的口服耐糖量测试平均值:6.4。这两组数据有显著差异,说明口服耐糖量测试对糖尿病检测有效性。
口服葡萄糖耐量试验是一种葡萄糖负荷试验,用以了解胰岛β细胞功能和机体对血糖的调节能力,是诊断糖尿病的确诊试验,广泛应用于临床实践中。具体试验方法是指给成人口服含75g无水葡萄糖的水溶液,儿童按每公斤体重1.75g计算,总量不超过75g,然后分别于0.5、1.0、2.0小时采血 ,测其血糖变化,以观察病人耐受葡萄糖的能力,是公认的诊断糖尿病的金标准。在血糖异常增高但尚未达到糖尿病诊断标准时,可采用该试验明确是否为糖尿病。
判断标准
1.当静脉空腹血糖<6.1mmol/L,OGTT2小时血糖<7.8mmoI/L,说明人体对进食葡萄糖后的血糖调节能力正常,为正常人。
2.当静脉空腹血糖≥7.0mmol/L或OGTT2小时血糖≥11.1mmoI/L,说明人体处理进食后葡萄糖的能力明显降低,可以确诊糖尿病。
3.当静脉空腹血糖<7.0mmol/L,并且OGTT2小时血糖介7.8-11.1mmoI/L之间,说明人体对葡萄糖的调节能力轻度下降,可以诊断糖耐量减低。
4.当静脉空腹血糖介于6.1-7.0mmol/L之间,且OGTT2小时血≤7.8mmol/L,说明人体对进食葡萄糖后的血糖调节能力尚好,但对空腹血糖调节能力轻度减退,可以诊断空腹血糖受损。
下图可见正常人和糖尿病患者的口服耐糖量测试OGTT数据分布是不一样的。
口服耐糖量测试OGTT实验结果不合格,表示身体细胞不能有效处理葡萄糖。如果空腹血糖和2小时后血糖检验都不合格,基本可以确定糖尿病。
胰岛素释放实验
胰岛素释放试验(Ins)反应基础和葡萄糖介导的胰岛素释放功能。
Toby本次实验统计非糖尿病的胰岛素释放实验平均值为:3.04,
糖尿病的胰岛素释放实验平均值为:5.85,两组数据有显著差异。说明胰岛素释放试验能够很好反应糖尿病。
胰岛素释放试验就是令病人空腹时定量口服葡萄糖(或馒头),使血糖升高刺激胰岛β细胞释放胰岛素,通过测定空腹及服糖后0.5小时.1小时、2小时、3小时的血浆胰岛素水平,来了解胰β细胞的储备功能,也有助于糖尿病的分型及指导治疗。
下图是胰岛素释放试验,正常人和各种患者的血浆胰岛素浓度分泌变化比较表。
正常人空腹血浆胰岛素浓度,测试时胰岛素浓度达峰时间和胰岛素分泌达峰浓度如上表,其余患者的反应如表中所列。
糖尿病时,无论空腹还是胰岛素释放试验分泌曲线均较常人有明显不同,一是胰岛素分泌减少,空腹胰岛素水平降低;二是胰岛素分泌迟缓,高峰后移。其中1型糖尿病与2型糖尿病,在胰岛素分泌曲线和空腹胰岛素水平上也有明显的不同,而各自具有不同的特点。
1型糖尿病患者空腹血浆胰岛素水平明显低于正常,其基值一般在5mu/L以下,服糖刺激后其胰岛素释放也不能随血糖升高而上升。常呈无高峰的低平曲线,有些病人甚至不能测得。
2型糖尿病患者空腹胰岛素水平可正常,或稍低于正常,但往往高峰出现的时间延迟,如在服糖后2小时或3小时出现,呈分泌延迟高峰后移。(而你是在30-60分钟胰岛素分泌是高峰)其中尤其是肥胖的糖尿病病人,血浆胰岛素释放曲线明显高于正常,但低于同体重的非糖尿病病人的释放曲线。
胰岛素瘤患者,肿瘤分泌不受血糖浓度调节,血浆胰岛素水平明显高于正常人,正常血糖的生理调节反应改变,胰岛素分泌过多。
相关课程
完整科大讯飞-糖尿病遗传风险检测挑战赛数据集和Python建模代码,视频讲解来源课程《python机器学习-糖尿病数据挖掘》。该课程有下属三个案例Python复现代码,建模糖尿病数据集,视频讲解,课后答疑群。
1.美国北卡罗来纳州立大学糖尿病血糖预测模型
2.Pima印第安人糖尿病风险预测模型
3.科大讯飞-糖尿病遗传风险检测挑战赛
欢迎商务合作
如果您们对糖尿病遗传风险检测模型项目感兴趣,欢迎各大医疗机构,科研机构,生物医药企业联系,QQ:231469242,微信:drug666123。
相关文章和视频
糖尿病数据独家震撼挖掘-基于上百万临床实验数(硬核,收藏)
AI糖尿病遗传风险检测模型-企业科研_论文毕设_专利
《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业科研
糖尿病视网膜病变预测模型-机器学习-人工智能
机器学习建模-糖尿病肾病预测模型