代码公开可复现!贝勒医学院单细胞+空转+机器学习轻松拿下8.7分1区,三大组合技想不发高分都难

文摘   2024-07-17 19:00   山东  

各位宝子们大家好,这里是出门被热到扭曲的船长。是时三伏天,天气热如汤。前几天看天气预报说,今年的“三伏”天又又又是加长版,暑假留校的小伙伴还好吗,当然了暑假也不能延误科研的脚步!今天船长就给大家带来一篇多组学研究妊娠期糖尿病的文章~

我们知道,糖尿病可以分为1型、2型、特殊型和妊娠期糖尿病(GDM),我国GDM发病率为17.5%,可不要小看这个比例,相当于每6个孕妈妈就有1人是“糖妈妈”,现在我们的临床困难有啦,然后又用到了单细胞、空间转录组和机器学习,想不发高分都难。跟上船长的脚步,点赞关注不迷路~这就带大家把这篇文章学起来~

1、多组学数据整合:文章通过结合批量RNA测序、单细胞RNA测序和空间转录组学技术,实现了对妊娠期糖尿病胎盘基因表达的全面分析。并利用机器学习模型,对高通量测序数据进行深度挖掘,以预测糖尿病亚型并识别关键基因。

2、实验验证与机器学习模型:采用RT-qPCR对关键基因进行独立验证,增强了研究结果的可靠性。此外,机器学习模型的应用不仅提高了分类的准确性,还有助于无偏地识别新的生物学假设。ps:非常难能可贵的是这篇文章把数据和脚本都已经共享啦,想复现这个思路但不知道如何入手?想个性化设计生信创新思路?快来扫码联系船长吧!这里有无数高分文章套路可复现!

定制生信分析

云服务器租赁

加好友备注“99”领取试用

后台回复321获取原文献,文献编号20240715

题目:妊娠期糖尿病疾病分类伴随离散胎盘基因表达特征

杂志:AMERICAN JOURNAL OF OBSTETRICS AND GYNECOLOGY

影响因子:IF=8.7

发表时间:2024年05月

研究背景

诊断妊娠期糖尿病(GDM)与2型糖尿病(T2DM)存在临床困难,包括GDM定义不精确、鉴别诊断复杂、早期诊断挑战、诊断时间差异、研究结果异质性及检测和验证的复杂性。GDM与T2DM均表现为胰岛素抵抗和胰岛素分泌不足,而区分两者依赖于产后GTT,这对当前妊娠无帮助且依赖于孕外医疗资源。

研究思路

这篇文章利用批量和单细胞RNA测序技术结合空间转录组学分析,对胎盘组织样本进行了深入的基因表达研究,并通过独立的验证队列和RT-qPCR技术确认了关键基因的表达差异。进一步应用机器学习模型来预测胎盘转录组样本的糖尿病状态,揭示了不同糖尿病亚型在胎盘基因表达上的独有特征,并探讨了这些特征与胎盘细胞亚群及微环境的关系。

数据来源

数据集/队列

数据库

数据类型

详细信息

GSE249311

GEO

Bulk RNA seq

11 个对照,5 个GDMA1,9 个GDMA2,5 个T2DM

GSE222987

GEO

空间转录组

健康对照胎盘(n=4)、无症状SARS-CoV-2(n=4;无COVID-19症状)和有症状(n=5;肺炎、呼吸衰竭)胎盘

GSE173193

GEO

单细胞测序

PE、GDM、老年组和对照组分别有2个胎盘样本

EGAD00001003705

European Genome-Phenome        

单细胞测序

10 个胎盘样本

主要结果

1.对妊娠期糖尿病患者胎盘的基因表达分析

作者通过一个精心设计的病例-队列研究,对比了孕前糖尿病(T2DM)和妊娠期糖尿病(GDM)亚型(GDMA1和GDMA2)患者的胎盘基因表达差异。与对照组相比,GDMA2和T2DM患者的平均分娩孕周较短,T2DM组的妊娠高血压疾病患病率显著更高。通过两阶段的研究发现队列,包括30个经过严格分类的样本和24个未经分类的对照样本,利用bulk RNA-seq技术揭示了与糖尿病分类一致的胎盘基因表达特征(图1A),并识别了相对于对照组每种糖尿病亚型有8749个显著差异表达的基因(图1B)。

在研究的第二阶段,作者通过qRT-PCR技术对先前通过RNA-seq分析筛选出的9个标记基因在非重叠验证队列的122个胎盘样本中进行了验证,这些样本来自经过产后葡萄糖耐量测试分类的非糖尿病对照组、GDMA1、GDMA2和T2DM患者(图1C)。验证结果揭示了CSH1、EGFR、PER1、SOGA1、SOD3、DOCK5、IL2RB、FOXO1和PIK3CB等基因在不同糖尿病亚型与对照组间的表达差异,这些基因涉及葡萄糖调节、肥胖、胰岛素抵抗和葡萄糖代谢等生物学过程。

图1 对临床表现良好的既往糖尿病或妊娠糖尿病患者进行的原始转录组分析,以及对已去标识和未分类的患者标本进行的比较队列分析

2.GDMA1亚型基因特征与映射到功能通路的不同通路调控有关

与对照组相比,研究者发现了6754个显著的差异表达基因(图2A),其中RMRP基因是最为显著上调的基因,GDMA1在多个样本中可重复(图2B)。通过使用GO生物途径数据库进行功能富集分析,识别出263个显著富集的术语。为了确定这些显著富集术语中的基因是否有重叠,选择了两个密切相关的类别——染色质重塑甲基化(图2D),最终发现了包括DNA甲基转移酶1(DNMT1)、增强子锌指同源物1(EZH1)和ATRX染色质重塑因子(ATRX)在内的9个关键表观遗传调控因子的重叠。

在4287个显著上调的基因中,对前3000个基因进行了重新分析,并可视化了前5个节点,揭示了与染色质重塑、基因表达的表观遗传调控、凝血和同型细胞-细胞粘附相同的途径中的顶级模块(图2E)。相反,2467个显著下调的基因揭示了围绕线粒体功能的模块,包括跨膜运输、呼吸链复合物组装、翻译和核糖核蛋白复合物生物生成(图2F)。

图2 GDMA1糖尿病亚型基因特征与映射甲基化和染色质重塑转录通路的不同调控有关

3.GDMA2 亚型基因特征与细胞新陈代谢、细胞-基质粘附和伤口愈合相关通路的不同调控有关    

与对照组相比,研究者发现了3315个显著的差异表达基因(图3A),其中ALB是GDMA2受影响参与者胎盘中上调最显著的基因,并且在139个显著富集的术语中(图3B)最为突出。研究者还发现HSPA8参与了3条途径,并识别了11个在生物学上具有重要意义的多途径中的显著DEGs。

进一步分析这些途径中基因表达变化的方向性后,研究者根据分子功能将1678个上调和1637个下调的基因分类为不同的GDMA2基因签名模块(图3E和3F)。细胞-基质粘附、细胞质翻译和创伤愈合途径被上调,而线粒体基因表达、线粒体翻译、呼吸链复合物组装和转运RNA代谢处理则被下调。

图3 GDMA2糖尿病亚型基因特征与伤口愈合相关通路的上调有关

4.T2DM糖尿病亚型基因特征与染色质重塑上调有关

研究者发现了5989个显著的差异表达基因(图4A)。功能富集分析识别了256个显著富集的术语,包括染色质重塑、甲基化、核运输和RNA剪接途径,这些途径被进一步分析以确定可能的基因网络。随后发现SETD2、TRIM28、SPT6同源物、SUPT6H参与了这4条途径中的3条,并识别了50多个涉及多途径的额外显著DEGs。

1678个上调和1637个下调的基因揭示了T2DM特有的基因签名模块(图3E和3F)。令人惊讶的是,与GDMA1参与者的胎盘转录分析类似,T2DM参与者的胎盘转录分析也显示了染色质重塑、组蛋白修饰、组蛋白赖氨酸甲基化和小GTP酶介导的信号传导途径的上调,而线粒体基因表达、翻译、呼吸链复合物组装、翻译、核糖核蛋白复合物组装和核糖体生物生成则被下调。

图4 T2DM糖尿病亚型基因特征与染色质重塑通路的上调有关

5.按妊娠期糖尿病疾病分类解析胎盘 DEGs 的空间和单细胞分辨率

研究者发现GDMA1、GDMA2和T2DM的标记基因分别与28、24和33个细胞类型或空间位点显著相关(图5A)。对所有291,871个转录组进行了降维,包括独立分析了来自Yang等人的19,324个转录组,这些转录组来自对照组(n=2)、GDMA1(n=1)或GDMA2(n=1)的胎盘样本(图5A)。

bulk RNA-seq分析中鉴定出的独特糖尿病基因映射到胎盘图谱中采样的胎盘区域(图5B)。通过单细胞RNA测序数据的子集分析,观察到GDMA1基因与滋养层外细胞对齐,而GDMA2与巨噬细胞对齐(图5C)。最后对空间基因表达进行可视化,收集了来自4个健康且非糖尿病对照个体的胎盘进行空间转录组分析,并在绒毛膜、蜕膜、羊膜和胎盘实质中可视化了关键基因的空间表达(图5D)。

图5 按妊娠期糖尿病疾病分类解析胎盘差异表达基因的空间和单细胞分辨率

6.从胎盘转录数据中提取机器学习预测模型,实现准确的糖尿病疾病分类

作者通过构建四个随机森林机器学习模型,分析了来自已知对照组和糖尿病参与者的胎盘转录组数据,以及一些临床数据未知的样本。在训练阶段,模型展示了不同的OOB错误率(图6C),但在验证阶段,所有模型都达到了100%的灵敏度和特异性。此外,这些模型成功预测了未知样本的糖尿病表型,其预测结果与已知样本的基因表达数据一致(图6D与图1A),表明机器学习可以成为识别和分类糖尿病亚型的有力工具。

图6 从胎盘转录数据中提取机器学习预测模型进行糖尿病分类

文章小结

这篇文章通过结合批量和单细胞RNA测序技术以及空间转录组学分析,对妊娠期糖尿病的胎盘基因表达进行了深入研究,并通过定量RT-qPCR验证了关键基因的表达差异。进一步利用机器学习模型,从胎盘转录组数据中准确分类糖尿病疾病,并通过模型分析揭示了对分类贡献最大的基因和长非编码RNA。通过这些技术方法,研究揭示了GDMA1、GDMA2和T2DM在胎盘基因表达上的特异分子特征,并为未来的临床诊断和治疗提供了可能的生物标志物。如果你也对机器学习、单细胞和空间转录组感兴趣,或是有进一步需求的小伙伴,欢迎来后台滴滴船长哦,还能手把手教你数据挖掘,公共数据库一网打尽!

船长寄语


船长可以为您提供以下服务哦:评估思路(免费)、生信分析、方案设计、服务器租赁、特色数据库搭建等!欢迎大家扫码咨询,有问必答!

生信分析

思路设计

服务器租赁

扫码咨询船长

往期推荐



1、要想发高分,dirty work少不了!DNA甲基化结合多组学和单细胞转录组,只需一点实验就拿下了1区9.1分!
2、可是导师,人生是旷野!仅凭单细胞转录组拿下14.7分的Nature Communications什么水平!
3、2024如果你考虑cell旗下的杂志,这30本支持一稿多投!
4、双热点又来镇场子啦!西南医科大学结合铁死亡+铜死亡+整合单细胞数据直接拿下Q1区SCI,换个方向就能复现!


生信海
怕错过生信热点?来生信海,船长日更不落伍!船长擅长思路设计、个性化生信分析、高分文献复现、特色数据库搭建等,欢迎来撩~
 最新文章