IF 12.4/Q1!三校联手共同打造数据整合利器!scRNA-seq+转录组+机器学习,用这个思路上分,体验“飞”一般感觉!

文摘   2024-11-14 18:00   上海  
哈喽哈喽~宝子们,有没有想大海哥呀!大海哥最近一直遨游在浩瀚的学术海洋中,可谓是浑身舒畅呀!这不今日偶遇一篇佳作,赶紧屁颠屁颠来找宝子们了~~这篇可是由华中科技大学、海南大学及昆明医科大学顶尖科研团队携手打造的力作,荣登一区Top!下面大海哥就来解读一下这篇文章:
这篇文章巧妙运用单细胞测序(scRNA-seq)、转录组学和机器学习的前沿技术,为神经内分泌前列腺癌(NEPC)的鉴定和前列腺癌(PCa)的监测提供了一个有价值的工具。话不多说,我们直接来看一下这篇scRNA-seq+转录组+机器学习的独特之处吧!
单细胞测序这项研究抓住热点在单细胞水平上通过编译来自9个多中心PCa数据集的综合scRNA-seq参考图谱,观察到11个与已发表的NEPC基因集之间的不一致和低效性能
机器学习:作为数据分析方法,与单细胞测序进行整合,使作者开发了一个综合分析通道,确定了762个高质量的NEPC标记,可谓是老树长嫩芽,创新值拉满。面对庞大的单细胞数据量,个人电脑的运算能力往往力不从心,容易陷入“慢动作”。不必担心,来找大海哥,大海哥为您的数据处理之路加速!同时无论是您思路卡壳还是分析不懂都可以来找大海哥帮忙哦~


定制生信分析

云服务器租赁

加微信备注99领取使用


题目:单细胞和批量转录组学的综合分析开发出一个强大的神经内分泌细胞内在特征来预测前列腺癌进展
杂志:Theranostics
影响因子:IF =12.4
发表时间:2024年9月1日
公众号后台回复关键词“999”即可获得原文,文献编号:241114
研究背景
神经内分泌前列腺癌(NEPC)通常具有严重的致命性和有限的治疗选择。NEPC细胞的精确鉴定对于研究和临床应用都具有重要意义,但有效的NEPC生物标志物仍有待确定。前列腺癌(PCa)是男性中第二常见的癌症,影响全球数百万男性。
数据来源
公共数据可从TCGA研究网络门户网站、GEO、cBioPortal或相应的数据集获得。作者研究期间生成的所有数据均包含在手稿和支持文件中。所有分析脚本都可在GitHub网站(https://www.example.com Famingzhao/NEPAL_RawCode)上公开获取
研究方法
1.单细胞数据处理:在本研究中,作者共收集并分析了11个scRNA-seq数据集,然后应用Seurat(v4.1.0)鉴定表达的基因,并进行主成分分析。2.批量数据集选择和准备:作者收集了来自15个公开可用的人类散装PCa数据集的3000多个样本。3.批量转录组数据处理:从GEO下载转录组测序数据,使用Sctransform方法对转录组测序数据进行标准化和校正。3.NEPC低、高危人群肿瘤突变状况分析:在文献中检索NEPC和前列腺腺癌之间已发表的NEPC基因集。4.NEPC预测模型的建立与验证:通过R软件包进行基因集富集(GSEA)分析。    
研究内容
1.先前的NEPC基因组显示出低一致性和低效力
作者收集并分析了所有11个已发表的NECP标志物基因集,包括来自批量转录组学数据的9个NEPC基因列表、来自正常前列腺的scRNA-seq的1个NEPC基因列表和来自MSigDB数据库的1个代表性泛NEPC。但这些基因组中观察到低重叠率。为了评价这些NE标志物的灵敏度和效率,作者基于9个已发表的人PCa scRNA-seq数据集,生成了一个综合scRNA-seq参考图谱,其中包含来自66个PCa肿瘤的总计210879个单细胞,涵盖原发性HSPC(Pri)、CRPC、mCRPC和NEPC(图1)。通过相应的生物标志物鉴定了总共15种细胞类型,然后计算每个样品的NE肿瘤细胞的频率(图1B)。
图1.scRNA-seq分析显示
2.基于大型scRNA-seq和bulk RNA-seq元数据库的NEPC分类器构建
为了鉴定高质量的NEPC特征标记物,作者设计了一个通道,该通道包括如上所述的公开的NEPC_Meta标记物、基于批量RNA-seq数据集的WGCNA基因模块PCaProfiler和作者组装的PCa scRNA-seq元图谱(图2A)。最后,鉴定了587个上调和184个下调的NEPC特征基因(图2B)。由于发现集中于癌细胞内在基因表达的标记在临床上更有用,我们还通过将NE_FG与NE肿瘤细胞的DEG重叠,获得了两个细化的NEPC细胞内在基因标记,称为NE_UP(n = 90)和NE_DN(n = 40)(图2C)。    
图2 基于scRNA-seq和bulk RNA-seq元数据库的多种策略组合
3.PCa的发展途径
除了区分NEPC之外,作者假设NEPAL可以量化NEPC进展,因为它将上调和下调的NEPC细胞内在特征基因并入模型中。为了评估这一假设,我们首先从scRNA-seq元图谱中重新聚类21,526个NEPA肿瘤细胞,这导致鉴定出8个一般NEPC亚群(图3A-B)。与最近的报道一致,经典NE标志物如CHGA、SYP、ENO 2和NCAM 1在这些亚群中不均一地表达(图3C)。重要的是,相比之下,具有AUCell算法的NEPAL在所有NEPC亚群中几乎普遍表达(图3D)。接下来,对8个NEPC亚群进行伪时间和CytoTRACE分析(图3 E-F),并且进化轨迹与NEPAL风险评分高度相关(图3G),表明其在预测NEPC进展中的效用    
图3 PCa的发展途径
4.NEPAL在前列腺癌实验模型中的应用
作者为了验证其实用性,进一步应用NEPAL从PCa的实验模型中获得的转录组图谱。对于来自CCLE的8种人PCa细胞系,NEPAL准确地指定NEPC细胞系NCHI-H660具有最高的NEPC风险评分。发现在患者和PDX肿瘤中,NEPAL评分与AR/NE状态的演变密切相关(图4A)。一致地,观察到预测的NEPC风险评分和NE标志物之间的高Pearson相关系数(图4B)。在独立的PDX队列中重复检测到类似的相关性(图5C-D)。此外,这种现象并不限于PCa,因为NEPAL在两个小鼠PCa数据集GSE 69903(图4E)和GSE 90891 中显示出一致的性能。最后,使用最近的小鼠PCa模型的RNA-seq数据集,NEPAL在预测NEPC状态方面再次表现出上级准确性,这导致存活率的显著分层(图4 F)。这些结果加强了NEPAL作为识别NEPC的一个有吸引力的工具的力量。    
图4 PDX数据集和小鼠模型对NEPAL的应用
5.NEPAL的预测价值和生物学相关性
作者为了评估NEPAL模型的预后测价值,收集了12个独立的批量转录组数据集(8个原发性HSPC队列和4个CRPC/Met队列),其中有超过2000个人PCa样本,其中10个具有可用的预后信息。作者观察到NEPAL有效地分类了HSPC的生化复发(BCR)和晚期PCa患者的总生存期(OS)(图5A-C)。NEPAL还可靠地预测了对化疗和ARSI的耐药性。此外,没有观察到NEPAL评分的显著差异,同时还包括传统的临床参数,如PSA评分、Gleason评分和肿瘤分期。在10个多中心PCa队列中,NEPAL是比其他模型和传统临床参数最强大的特征(图5D),揭示了NEPAL模型在预后预测中的稳健性。    
图5 人类前列腺癌数据库中与NEPAL相关的预后和分子特征
文章总结
作者构建并广泛验证了一个强大的NEPC风险预测模型NEPAL,这是一个用于基础研究目的的NEPC精确识别的有力工具,并为未来的临床研究奠定了坚实的基础。好啦,大海哥今天就分享到这里,但如此精彩的文章,怎能不分享给身边的小伙伴呢?顶尖的研究思路已为您呈现,大海哥同样擅长生信分析,可以为您提供全面的单细胞数据挖掘与分析服务,为您的SCI发表之路助力!欢迎随时联系大海哥!


医学海公众号持续为大家带来最新科研思路,想复现这种思路或者定制更多创新性思路欢迎直接call大海哥,竭诚为您的科研助理!


最新热点思路

文献思路复现

创新思路设计

服务器租赁

往期推荐

我缺的是Nat Commun吗?我缺的是撬动它的王炸思路!暨南大学团队:微生物组+代谢组学+转录组,这热点把握度,绝了!

超绝思路新鲜出炉!直接平地起高楼?准备好迎接国立成功大学林世杰团队“铁死亡+线粒体”把“毛坯”秒变“精装”的科研震撼吧!

震惊!只研究1种交互作用就拿到21分+?快进来学最严谨的交互作用分析方法

         

 

         

 

   

医学海
实用医学学术平台:专注分享生物医学方向最新热点研究,高分思路分享
 最新文章