双热点又来镇场子啦!西南医科大学结合铁死亡+铜死亡+整合单细胞数据直接拿下Q1区SCI,换个方向就能复现!

文摘   2024-07-11 19:00   山东  

哈喽,各位小伙伴们最近科研还顺利吗,不顺利的话也没关系,今天船长给大家带来一支研究潜力股,非肿瘤文章怎么做,看完这篇你就有新思路啦~

铜死亡自Tsvetkov等人提出刚好两个年头,但该领域的资助金额和资助项目数量呈爆发式的增长,未来甚至有与铁死亡热点抗衡的趋势,在之前的文章报道中,铁死亡研究得比较多,与疾病的关系也比较明确。我们分析的时候可以多热点搭配,又是创新性拉满的高分文章!就像这篇文章,不仅用到两种细胞死亡的热点,最后还加上了单细胞分析收尾,两大热点+干湿结合的经典套路,生信小白也能轻松拿捏。

1、综合生物信息学与机器学习:整合了多个公共基因表达数据集,并运用SVM-RFE、LASSO和RF等机器学习算法筛选出具有高诊断价值的生物标志物。

2、实验验证与单细胞分析:通过WB和免疫荧光染色等实验技术对预测的生物标志物进行验证,随后基于筛选出的生物标志物构建列线图模型,并使用CIBERSORT工具分析免疫细胞亚群在OA中的浸润差异,最后应用scRNA-seq技术揭示OA样本中的细胞异质性,再利用CellChat工具分析细胞间通信。        

综合来看,研究者运用了多种生物信息学和统计学方法,为骨关节炎的生物标志物发现和病理机制提出了新的理解~ps:这篇文章生信含量极高,工作量和实验验证都在线,编辑看了直点头,并且可复现性极强!想做类似方向可以找船长帮忙哦。另外,单细胞分析涉及的数据量较大,笔记本可能都忙不过来啦。这个时候可以看看我们提供的服务器租赁服务!省时省力,助力科研。感兴趣的宝子欢迎后台戳戳船长哦~

定制生信分析

云服务器租赁

加好友备注“99”领取试用

后台回复321获取原文献,文献编号20240711

题目:利用生物信息学分析和实验验证骨关节炎中铜死亡相关基因和铁死亡相关基因结合的新特征

杂志:Arthritis Research & Therapy        

影响因子:IF=4.4

发表时间:2024年05月

研究背景

骨关节炎(OA)作为一种退行性病变,临床上主要面临症状严重影响生活质量、结构变化广泛、患病率上升、现有治疗手段有限、对病理生理机制理解不足等困难。特别是铁死亡和铜死亡这两种细胞死亡方式与OA的密切关联及其在疾病发展中的作用尚需深入研究。

研究思路

作者首先利用生物信息学分析识别与铜死亡和铁死亡相关的新型基因签名(c-FRGs),然后通过功能富集和蛋白质相互作用网络构建,结合机器学习算法筛选出潜在的OA生物标志物。进一步通过实验验证这些生物标志物的表达差异,并构建疾病模型评估其诊断效能。此外,还包括了药物预测、ceRNA网络分析、免疫细胞浸润分析以及单细胞测序分析,以揭示这些基因在OA中的多功能角色。下图为研究流程图:

      

数据来源

数据集/队列

数据库

数据类型

详细信息

GSE55235

GEO

Bulk RNA seq

包含正常人类滑膜样本25个和OA滑膜样本32个

GSE169077

GEO

Bulk RNA seq

包含正常人类滑膜样本25个和OA滑膜样本32个

GSE55457

GEO

Bulk RNA seq

包含正常人类滑膜样本25个和OA滑膜样本32个

GSE55584            

GEO

Bulk RNA seq

包含正常人类滑膜样本25个和OA滑膜样本32个

GSE82107

GEO

Bulk RNA seq

包含7个正常样本和10个OA样本,验证集

GSE152805

GEO

scRNA-seq

包含3个OA患者的单细胞测序数据


主要结果

1.提取c-FRGs并获得差异表达的c-FRGs

作者合并了GSE55235、GSE169077、GSE55457和GSE55584这四个数据集。新生成的基因表达矩阵经过标准化处理,并通过PCA图展示(图2a和2b),验证了样本数据的合理性。

基因关联分析中,共发现63个铁死亡相关基因(FRGs)与11个铜死亡相关基因(CRGs)有密切关联(图2e)。随后进行差异表达基因识别,总共确定了4167个DEGs(图2c)。在这些DEGs中,进一步识别了40个特定的差异表达基因(c-FDEGs),包括13个上调基因和27个下调基因(图2d)。这些c-FDEGs的表达模式通过heatmap可视化(图2f)。

图2 提取特定的铁突变相关基因并获得差异表达的c-FRGs

2.功能富集分析

GO富集分析显示c-FDEGs在调控炎症反应、细胞分解过程的正向调控、自噬体膜、循环内体以及NF-κB结合等方面显著富集(图3a)。KEGG通路分析表明,这些c-FDEGs主要参与IL-17信号通路、NOD样受体信号通路、HIF-1信号通路和TNF信号通路(图3b)。基因集富集分析(GSEA)提示OA的发展可能与缺氧、MYC靶标v2、P53通路、炎症反应、通过NF-κB的TNFα信号、干扰素-α反应和过氧化物酶体相关(图3c和d)。

(ps:功能富集分析也可以用船长新开发的零代码生信分析小工具实现,云生信分析工具平台包含超多零代码分析和绘图小工具,上传数据一键出图,感兴趣的小伙伴欢迎来尝试哟,网址:http://www.biocloudservice.com/home.html)

图3 功能富集分析

3.PPI网络的构建

STRING数据库用于检索已知和预测蛋白质之间的相互作用,作者使用其探索所有40个c-FDEGs之间的相互作用。将c-FDEGs导入STRING数据库后,删除了孤立的c-FDEGs,并添加了六个与铜死亡相关的基因(CRGs),但不包括CDKN2A,从而构建了PPI网络。构建的PPI网络通过Cytoscape软件进行可视化(图4a)。

使用Cytoscape软件中的cytoHubba插件计算了PPI网络中节点的度值(degrees),识别出了七个关键基因,包括IL6、IL1B、RELA、PTGS2、EGFR、CDKN2A和SOCS1(图4b)。这些hub genes在PPI网络中可能扮演着核心角色,它们可能在OA的发病机制中具有重要的调控功能。

图4 蛋白质-蛋白质相互作用网络和核心基因筛选

4.基于机器学习算法对OA患者生物标志物进行筛查

为了从40个特定差异表达基因(c-FDEGs)中筛选出与OA相关的潜在生物标志物,采用了多种机器学习方法对c-FDEGs进行分析,以识别最有可能与OA相关的基因。SVM-RFE分析显示,包含24个基因的模型具有最佳的准确性(图5a)。LASSO回归分析表明,当正则化参数λ等于12时,模型能够准确预测OA,生成了12个候选基因(图5b)。随机森林分析用于评估基因的重要性,保留了重要性大于1的候选生物标志物(图5c)。通过整合这三种方法的结果,最终确定了CDKN1A、FZD7、GABARAPL2和SLC39A14作为OA的潜在生物标志物(图5d)。

随后作者收集了6个OA患者样本和6个正常样本。使用WB免疫荧光染色技术进行分析。结果显示OA组中FZD7和GABARAPL2表达上调,CDKN1A和SLC39A14表达下调。这些实验结果与生物信息学分析一致,验证了这些基因作为OA潜在生物标志物的可靠性。

图5 基于机器学习的潜在生物标记筛选

5.差异表达c-FRG的ssGSEA、GSEA和GSVA分析

ssGSEA分析中(图7i),单样本基因集富集分析显示OA组在Notch信号、干扰素α(IFN-α)反应、Wnt/β-catenin途径、胆汁酸代谢和过氧化物酶体等方面显著富集。非OA组则在TNFα通过NF-κB信号、缺氧、MYC靶标v2、P53途径、炎症反应、PI3K AKT mTOR信号和IL6 JAK STAT3信号等方面富集(图7i)。

CDKN1A和SLC39A14与缺氧、TNF-α通过NF-κB信号、P53途径和mTORC1信号的基因集显著正相关。而GABARAPL2和FZD7与TNF-α通过NF-κB信号、PI3K AKT mTOR信号和mTORC1信号的基因集显著负相关(图7j)。

图7 四种潜在生物标记物的 GSEA、GSVA 和 ssGSEA 结果

6.疾病模型(列线图)的建立与验证

作者使用CDKN1A、FZD7、GABARAPL2和SLC39A4这四个生物标志物构建了一个疾病列线图模型。单独分析这些基因的AUC值分别为0.931、0.879、0.989和0.850,所有值均超过0.85,表明这些基因具有较好的诊断能力(图8a)。该列线图模型的AUC值为0.996,显著高于单独生物标志物的AUC值,表明该模型具有较高的诊断价值(图8b)。

为了验证模型的诊断意义,作者在GSE8207数据集上进行了验证。结果显示,四个生物标志物的AUC值均大于0.7,模型的AUC值为1,表明模型在验证集上具有完美的诊断效能(图8f)。这些结果表明CDKN1A、FZD7、GABARAPL2和SLC39A4是OA的有效疾病生物标志物,并且所构建的模型具有高效的诊断能力

图8 验证四种生物标志物

7.免疫浸润分析

作者利用CIBERSORT工具对OA样本与非OA组织间的免疫细胞亚群浸润差异进行了总结。OA样本中记忆B细胞、M0巨噬细胞、M2巨噬细胞和静止型肥大细胞的比例高于对照组,而静止的CD4记忆T细胞和活化的肥大细胞比例较低(图9a)。活化的肥大细胞与PTGS2、IL6和IL1B基因表达呈正相关,其中与PTGS2的相关性最强((图9b)。IL1B、PTGS2与M1型巨噬细胞、静止CD4记忆T细胞与PTGS2、调节性T细胞(Tregs)与RELA基因表达也呈正相关。而滤泡辅助T细胞与RELA、浆细胞与SLC39A14基因表达呈负相关(图9c和d)。

图9 CIBERSORTx免疫渗透结果

8.单细胞分析        

作者从GSE152805数据集中获取了三个OA滑膜样本的scRNA-seq数据,经过质量控制后,保留了10,194个细胞进行细胞注释。选择了2000个变异度最高的基因进行深入分析,并通过“RunPCA”函数进行降维处理,最终获得了14个细胞簇。随后使用标记基因对细胞进行注释,鉴定了七种细胞群体:成纤维细胞、巨噬细胞、树突细胞(DCs)、内皮细胞(ECs)、平滑肌细胞(SMCs)、T细胞和肥大细胞(图10a)。通过这些细胞群体的基因表达差异分析,验证了细胞注释的准确性(图10b)。

之后分析了七个枢纽基因四个生物标志物基因在不同细胞群体中的分布和表达情况(图10c和d),发现11个c-FRGs在巨噬细胞、DCs、肥大细胞和NK细胞中的表达显著不同。

使用CellChat工具识别了每个细胞群体中差异性过表达的配体和受体,共检测到254对显著的配体-受体对,并进一步分类为62个信号通路。发现免疫细胞之间的相互作用较弱,而非免疫细胞(如成纤维细胞、SMCs和ECs)与其他细胞有广泛的通讯互动,并参与多种旁分泌和自分泌信号交互作用(图10e至g)。

图10 三例OA滑膜样本的单细胞RNA测序数据分析

文章小结

这篇文章综合运用了机器学习算法、实验验证和单细胞RNA测序等方法,通过对骨关节炎(OA)相关基因的深入研究,成功识别并验证了OA的潜在生物标志物。首先从公共数据库中整合并分析了多个数据集,然后通过功能富集和蛋白质相互作用网络揭示了这些基因在OA中的可能作用,接着利用机器学习算法筛选出具有高诊断价值的生物标志物,并通过实验技术进行了验证。此外,通过构建疾病模型(列线图)和免疫细胞浸润分析,进一步评估了这些生物标志物的诊断效能和在OA免疫微环境中的作用。最终,还通过单细胞分析揭示了不同细胞群体的基因表达特征和细胞间通信网络,完成了一个漂亮的收尾!如果你也对机器学习、细胞死亡、单细胞分析感兴趣,或是有进一步需求的小伙伴,欢迎来后台滴滴船长哦,还能手把手教你数据挖掘,公共数据库一网打尽!

船长寄语


船长可以为您提供以下服务哦:评估思路(免费)、生信分析、方案设计、服务器租赁、特色数据库搭建等!欢迎大家扫码咨询,有问必答!

生信分析

思路设计

服务器租赁

扫码咨询船长

往期推荐



1、单细胞强强联合人工神经网络,两大当红炸子鸡助力大连医科大学纯生信发Q1,这对科研CP我先磕了
2、一招鲜,吃遍天!10种机器学习算法+101种组合出手即二区,这个屡试不爽的套路你掌握了吗!
3、这也太city了吧!北京大学詹思延教授团队整合蛋白质组+转录组+孟德尔随机化,纯生信拿下1区10分+!这个框架大有搞头!
4、【NC】经费足直接冲:复旦大学郁金泰等团队:全外显子组关联分析(UKB可申请数据)+孟德尔随机化一举拿下14.7分!

         

 

   

生信海
怕错过生信热点?来生信海,船长日更不落伍!船长擅长思路设计、个性化生信分析、高分文献复现、特色数据库搭建等,欢迎来撩~
 最新文章