手把手教你用机器学习找生物标志物:

文摘   2024-11-16 22:54   美国  

热门免费资源:

一、国自然类:


1 2023历年国自然标书全文

3 国自然项目答辩PPT

5 标书写作模板

7GraphPad 9安装包

2 2018-24年国自然清单

4基金插图素材(可编辑)

6近10年国自然标书全文

二、SCI生信+实验类:

1160套SCI实验操作视频

3 Meta分析范文+教程

5泛癌分析万能代码

7 130套SCI实验视频

9单细胞数据挖掘课

11统计分析万能模板

2100个SCI实验Protocol

4 miRNA预测靶基因代码

6动物实验操作视频汇总

GEO/TCGA数据挖掘课

10 SCI写作万能模板

三、科研绘图类:

PPT科研绘图素材合集

3Adobe illustrator绘图素材

5动物实验矢量图素材

7 PS修各种SCI实验图视频

资源共享群

PPT科研绘图插件VIP版

4 各种实验仪器矢量图素材

6细胞实验矢量图素材

AI科研绘图视频课

10 亲交友微信群


一、今日推送:

先给大家看看机器学习发SCI有多简单,作者利用公开数据集和机器学习算法,预测了炎症性肠病(IBD)患者冠状动脉疾病(CAD)的病变进展风险。总共就6个步骤:1. 差异表达基因(DEGs)鉴定,2.加权基因共表达网络分析,3. 基因富集分析及通过蛋白质互作网络鉴定差异表达基因,4.通过多种机器学习方法识别中心基因,5. 关键生物标志物的评估、确定及筹码图构建,6.关键生物标志物及诊断模型的评估:

l题目:通过机器学习和生物信息学策略识别预测炎症性肠病中冠状动脉疾病进展的关键生物标志物

l杂志:Journal of Cellular and Molecular Medicine

l影响因子:IF=5.295

l发表时间:2024年1月 

 

研究背景

炎症性肠病(IBD)是一组以肠道慢性炎症为特征的疾病,主要包括克罗恩病和溃疡性结肠炎。冠状动脉疾病是一种由于冠状动脉内部的粥样硬化斑块形成导致的心脏血供不足或完全阻塞的疾病,可能导致心绞痛、心肌梗死等严重后果。近年来已有多项研究发现IBD患者有较高的冠状动脉疾病(CAD)的风险。尽管已知炎症性肠病与冠状动脉疾病存在关联,但如何准确预测IBD患者中冠状动脉疾病的进展仍然是一个挑战。传统的临床标志物和评估方法可能不足以提供准确的预测,因此寻找新的生物标志物和评估策略成为当前研究的重点。而生物信息学和机器学习技术近些年得到了广泛的发展与应用,为生物医学研究提供了强大的工具。这些先进的技术可以对大量的基因表达数据进行分析,识别与疾病进展相关的关键生物标志物,并预测患者的疾病风险。    

数据来源

数据集/队列

数据库

数据类型

详细信息

GSE62646

GEO

mRNA表达数据

来源于外周血单核细胞

GSE123342

GEO

mRNA表达数据

来源于外周血样本

GSE75214

GEO

mRNA表达数据

来源于结肠粘膜

GSE36807

GEO

mRNA表达数据

来源于肠道活组织检查

GSE59867

GEO

mRNA表达数据

来源于外周血单核细胞

研究思路

研究团队通过多种生物信息学方法分析了与IBD患者中CAD进展相关的基因,通过差异表达基因(DEGs)分析筛选出与IBD关联的关键模块,并进一步通过PPI(蛋白质相互作用)网络分析筛选出中心基因。接着,研究人员利用机器学习算法(RF、SVM-RFE和LASSO回归)对这些候选基因进行筛选和评估,最终确定了五个与CAD进展有关的关键基因。最后通过ROC曲线和筹码图对这些基因进行了评估和验证。    

研究结果

1. 差异表达基因(DEGs)鉴定

研究人员首先使用了R中的‘Limma’包进行差异表达基因(DEGs)分析(图1A,1B),来识别不同表达水平的基因。研究人员对急性心肌梗死(AMI)患者组和冠状动脉疾病(CAD)患者组之间的基因表达进行了比较。设置统计标准为(|FC| > 2,p < 0.05),筛选出了570个DEGs,其中340个基因的表达水平上调,230个基因的表达水平下调。同样地,对IBD组与健康对照组之间的基因表达进行了比较,鉴定出了430个DEGs,其中283个基因上调,147个基因下调。    

图1 状动脉疾病与急性心肌梗死间与相关的差异表达基因分析

2.加权基因共表达网络分析

研究人员使用加权基因共表达网络分析(WGCNA)来识别基因共表达模块并确定与特定生物过程或疾病状态相关的关键模块(图2AB)。研究人员首先通过软功率值评估网络的尺度独立性和平均连接性,分析后设定最佳软功率值为16。研究人员对IBD数据集(GSE75214 + GSE36807)进行模块识别和合并,共识别出12个共表达模块(图2D,2E)。随后,通过计算每个模块与IBD特征(如疾病状态、临床参数等)之间的相关性,确定了暗橙色模块和蓝色模块在IBD中的显著正相关和负相关,具有最高的相关系数(图2F,2G)。 

图2症性肠病加权基因共表达网络分析

3. 基因富集分析及通过蛋白质互作网络鉴定差异表达基因

研究团队利用GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)两大功能富集分析工具,成功地鉴定出了85个在IBD相关显著模块和揭示CAD进展的DEGs中的共同基因。进一步的功能富集分析揭示,这些DEGs不仅在免疫应答、细胞内部结构及蛋白质同源二聚体活性等多个生物过程、细胞组分和分子功能上展现出显著富集(图3A-C),还在关键的生物通路如NOD样受体信号通路、Th17细胞分化,以及TNF/HIF-1信号通路中表现出高度富集(图3D)。为了进一步挖掘与CAD进展中的关键因子,研究团队构建了一个PPI(蛋白质-蛋白质相互作用)网络,研究人员通过精细筛选成功识别出了20个核心基因(图3F)。    

图3 IBD相关DEGs在AMI中的功能富集分析

4.通过多种机器学习方法识别中心基因

研究人员使用了随机森林(RF)、支持向量机递归特征消除(SVM-RFE)和LASSO回归等三种机器学习算法来筛选中心生物标志物。通过RF算法,研究人员根据基因的重要性选取了10个最有影响力的基因(图4A,4B)。接着通过SVM-RFE分析确定了预测CAD与IBD进展中准确率最高的前17个基因(图4C,4D)。最后,研究人员通过LASSO回归找到了九个在模型中能实现最低二项偏差的基因(图4E,4F)。通过对这三种算法的结果进行交集分析,得到了五个最有潜力的候选中心基因,分别是CTSD、CEBPD、CYP27A1、STAT1和S100A11。    

    

图4 使用多种机器学习算法选择冠状动脉粥样硬化病变进展的关键差异基因

5. 关键生物标志物的评估、确定及筹码图构建

研究人员接着对五个候选中心基因(CTSD、CEBPD、CYP27A1、STAT1和S100A11)在稳定CAD和AMI组中的相对表达水平进行了评估,并构建了ROC曲线来评估其预测稳定CAD发展为AMI的诊断能力。通过测试集和验证集的数据,发现这五个基因在预测CAD进展方面具有良好的诊断价值(图5A-5J)。在验证集中,CTSD、CEBPD和CYP27A1的AUC值都超过了0.8。最后,基于这三个基因构建了一个筹码图,通过量化每个基因的相对表达来评估IBD患者冠状动脉粥样硬化病变进展的风险(图5K),该筹码图的AUC值为0.89,表明其在预测性能方面具有很高的准确性(图5L)。    

图5 生物标志物预测能力的评估与回顾及诊断模型图谱构建

6.关键生物标志物及诊断模型的评估

研究团队深入分析了五个候选基因在稳定CAD和AMI组中的表达水平。研究人员在测试数据集(GSE62464 + GSE123342)和验证数据集(GSE59867)中进行了t检验或Wilcoxon秩和检验,结果显示这些基因在AMI组中与CAD组相比呈现出显著的表达差异。特别是CTSD、CEBPD和CYP27A1三个基因,具有高度显著性的表达差异(图6A,图6B)。    

图6 肝癌转移内异质性的表征

文章小结

这篇文章这篇文章利用了公开数据集和机器学习算法,预测了炎症性肠病(IBD)患者冠状动脉疾病(CAD)的病变进展风险。通过对多个相关数据集进行验证,该研究开发了一个新的风险评估工具。

(下滑查看更多)


难的是什么,不会写代码,不会个性化分析。没关系,我们给大家免费分享。只要你按照这个视频和代码,换一个疾病,分分钟就是一篇SCI。今天,给大家免费分享的是:


”非肿瘤列线图诊断模型机器学习联合WGCNA筛选生物标志物实操课(原价12399元)”

如下免费获取:

🔽①长按下方二维码关注🔽

②输入关键词:12399

②输入关键词:12399

②输入关键词:12399


课程如下:



套路非常简单,难得的是这一套代码,只要你换一个疾病,按照这个实操和代码操作,就是一篇SCI。非常适合零基础想极速发表SCI的同学。


”非肿瘤列线图诊断模型机器学习联合WGCNA筛选生物标志物实操课(原价12399元)”

如下免费获取:

🔽①长按下方二维码关注🔽

②输入关键词:12399

②输入关键词:12399

②输入关键词:12399

二、免费资源:

顶级CNS插图如下:



但是自己画一只小鼠可能需要花一整天的时间。


所以,今天小编给大家免费赠送:


“生物医学之家CNS插图可编辑素材永久VIP账户”


生物医学之家CNS插图素材部分截图如下:



这些素材都是用Adobe illustrator绘制的,打开后可以继续编辑修改,这些素材原价是9999元的,现在免费给大家送永久账户。如下免费获取永久VIP账户:


🔽①长按下方二维码关注🔽

②输入关键词:永久VIP

②输入关键词:永久VIP

②输入关键词:永久VIP


免费发送1万个永久VIP账户,有了这个账号之后,你可以无限、永久下载生物医学之家的CNS插图素材。共有1万张素材,囊括了各种生物、人体组织、细胞、病毒、植物等。素材首页如下:



一、比如我需要用到小鼠插图来描述自己的小鼠动物实验模型,那就直接搜索鼠,有几百张小鼠插图就出现了:



有了VIP账号之后就可以随意下载。下载下来是AI绘制的可编辑图:



可以随意修改颜色:



也可以随意修改大小:



Ctrl+c和V复制粘贴到自己的画板中,并对齐:



随后画一条线,示意要D369打药:



随后添加字体,这样审稿人一看就知道你做了什么动物模型。



最后保存和导出,一定要记得保存,保存就是矢量图了,以后还能修改。导出就是导出为图片,用来讲PPT或者投稿。



还在等什么?赶快免费获取账号呀,发SCI、作图的时候肯定用得着。


“生物医学之家CNS插图可编辑素材永久VIP账户”

如下免费获取:

🔽①长按下方二维码关注🔽

②输入关键词:永久VIP

②输入关键词:永久VIP

②输入关键词:永久VIP


还有,我们下载的素材,也可以右键取消分组:



然后修改任何一个你想要修改的元素,比如修改液体的颜色:



也可以将注射器放在背上,模拟皮下注射:



还可以将小鼠变为黑色:



还在等什么?赶快免费获取账号呀,发SCI、作图的时候肯定用得着。


“生物医学之家CNS插图可编辑素材永久VIP账户”

如下免费获取:

🔽①长按下方二维码关注🔽

②输入关键词:永久VIP

②输入关键词:永久VIP

②输入关键词:永久VIP


二、比如我需要绘制细胞机制图。那就搜索细胞:



有了这些素材,分分钟就可以绘制如下这种高分插图:



三、各种Nature插图原图:



下载下来之后每个细微的元素都可以修改:




我们一共上传1万张Nature插图。大家赶紧获取永久VIP账户吧,投稿绘图的时候用得着:


“生物医学之家CNS插图可编辑素材永久VIP账户”

如下免费获取:

🔽①长按下方二维码关注🔽

②输入关键词:永久VIP

②输入关键词:永久VIP

②输入关键词:永久VIP

更多免费资源:

三、科研绘图类:

1 GraphPad绘图模板

50套R绘图万能代码

直装版PS+AI安装包

医学统计分析R版

9单样本RNAseq分析

11 SnapGene序列比对

13 Endnnote安装包

15 R语言绘图模板

17中文版RNAseq教程

19 Image J图片处理视频

21 更多资源在更新中.....

2600套PPT模板

4Origin绘图模板

SPSS统计分析模板

8铜铁死亡分析代码

10m6A甲基化分析代码

12qPCR计算模板

14英文简历模板

16 R各种统计分析模板

1846套生信分析代码

20 Sigma plot绘图软件和视频

四、生信和写作类:

1 ChIPqPCR引物设计

3过表达引物设计

零代码复现6分SCI教程

零代码复现4分SCI教程

WGCNA分析课程

11 GO分析傻瓜式教程

13 GSEA分析傻瓜式教程

15 渐变火山图傻瓜式教程图

17 GEO+TCGA数据挖掘课

19 41GB的生信分析+实验资源

2 shRNA设计

4 Crispr-csa9素材

零代码复现5分SCI教程

8分SCI零代码复现步骤

10 超全生信数据库使用教程

12 KEGG富集分析教程

14 Meta分析范文+实操课

16 交集基因筛选高级教程

18 生信软件合集

辛苦整理,全文无任何广告!

觉得有用的话,您就点个在看、点赞!

生物医学之家
请给我发信息,我24小时在线,领取资源请发有效截图哦!
 最新文章