这对热点“搭子”错过悔一年!搭配上机器学习+预后模型,一区SCI近在咫尺,临床医生们还在等啥?

学术   2024-10-23 19:00   上海  
国庆小长假刚结束,满怀诗和远方的放飞心收回来没?要是没有,一定得看小云这篇文章,一秒给你拉回科研状态!速看速看~
研究主题是关于头颈鳞状细胞癌的,以前也介绍过不少类似主题文章,但是这篇不一样了,作者利用机器学习算法,从超级增强子(SE)相关基因中开发了一种新的预后模型,为头颈鳞状细胞癌(HNSCC)的个性化治疗提供了可能。特别的一点是,他们通过随机生存森林算法(RSF)筛选出了具有预后意义的SE相关基因,构建了预后标志物,这在精准医疗领域是一个显著的进步。该研究不仅提供了一种新方法,还找到了治疗疾病的新靶点,一举两得的研究思路不正是小伙伴们苦苦追寻的吗~
提到的两个热点词:超级增强子+机器学习,这些都是现在科研界的大热门,掌握了这些技术,发文简单不说,主要是将来不管找工作还是继续深造,都是大大的加分项!这篇优秀在哪?关键就是作者还提供了大量的实验数据和分析方法,简直就是手把手教大家如何做研究啊~感兴趣就跟着小云一起瞅瞅,再讨论讨论,碰撞出更多灵感的火花!
PS:这个思路真的很容易复现!不吹不黑,满足毕业和职称需要绝对够了,换个疾病就能轻松上分,都说到这了还不心动?那小云就要帮其他小伙伴设计思路咯,早上车早发文才是正解~ 

定制生信分析

云服务器租赁

(加微信备注99领取试用)


题目:通过机器学习在头颈部鳞状细胞癌中开发一种来自超增强子相关基因的新型预后特征
杂志:Oral Oncology
影响因子:IF=4.0
发表时间:2024年97日
研究背景
头颈鳞状细胞癌(HNSCC)是全球范围内常见的恶性肿瘤之一,其治疗和预后面临重大挑战。传统的治疗手段效果有限,患者长期生存率低,尤其是晚期复发或转移性病变。因此,寻找新的生物标志物和治疗靶点是提高HNSCC治疗效果的关键
数据来源
原始测序数据
从 NCBI Gene - Expression Omnibus(GEO)获取原始的 H3K27ac ChIP - seq 和 ATAC - seq 数据集,包括 GSE128275(Cal27,HN12)、GSE131710(SCC1)和 GSE103554(SCC25)。    
基因表达数据及临床信息
TCGA - HNSC 队列的基因表达谱及临床信息(训练队列)通过 R 包 “TCGAbiolinks”(版本 2.22.4)获得。
GSE41613 和 GSE42743 两个 HNSCC 队列作为验证队列。
研究思路

研究结果


1.SE 相关基因的识别
① 通过对 Cal27、HN12、SCC1 和 SCC25 四个 HNSCC 细胞系的 H3K27ac ChIP - seq 分析,利用 ROSE 算法识别出 SEs,其数量分别为 792、1020、911 和 1168。    
② 这些 SEs 主要分布在常染色体上,在性染色体上较少,且其区域的染色质状态开放,利于基因转录。

③ 将 SEs 分配给其附近的基因,得到 772 个独特的 SE - associated genes,去除冗余后在 TCGA - HNSC 数据集中分析发现 684/772 的 SE - associated genes 在肿瘤样本中相对正常样本上调。
④ GO 和 KEGG 分析显示这些上调基因显著富集在上皮细胞增殖、粘着斑和 PI3K - Akt 信号通路等,GSEA 分析也验证了这些结果。    

2.基于机器学习的预后模型构建
SEAGS 模型构建
① 通过单变量 Cox 回归分析在 TCGA - HNSC 数据集中识别出 133 个具有预后意义的 SE - associated 基因,利用 89 种机器学习算法组合构建预测模型,在三个独立队列中验证,RSF 算法表现最佳,平均 C - index 最高。
② 在 133 个候选基因中,87 个对 RSF 模型有正向重要性,选取重要性较高的前 30 个基因,其中包括 WNT7A 和 AXL 等癌基因。    
③ 根据 SEAGS 分数中位数将患者分组,高 SEAGS 分数患者生存明显更差,且该模型在调整多个临床病理参数后是独立预后因素,不同时间的 AUC 值也显示其良好性能。

模型验证
④ 在两个独立的 HNSCC 验证队列(GSE41613 和 GSE42743)以及合并队列中,基于 SEAGS 分数分组的患者生存分析结果与 TCGA - HNSC 队列一致,高 SEAGS 分数组患者预后更差,时间依赖性 ROC 曲线分析也显示模型有一定预测能力。    

3.预测列线图的构建
将宫颈淋巴结转移、肿瘤大小和 SEAGS 纳入构建预测列线图,校准曲线显示该列线图在预测 1 年、3 年和 5 年总生存率(OS)方面表现出色,决策曲线分析表明 SEAGS 加上肿瘤大小在预测患者生存方面比单独的特征或其他临床病理参数有更多净收益。 

4.WNT7A 基因的功能验证
如何发现WNT7A 是关键基因?
① 通过 RNA - seq 分析发现 WNT7A 是 SEAGS 成员且在 NEO2734 处理后显著下调,在肿瘤样本中高表达,且是独立预后因素。
② 在 WNT7A 基因位点有显著的 H3K27ac 富集和染色质可及性,通过 ChIP - qPCR 验证了 H3K27ac 和 EP300 在其 SE 区域的富集,且 JQ1 或 NEO2734 处理可降低其富集和 mRNA 表达。    

WNT7A 的功能涉及哪方面?
③ 通过 siRNA 介导的敲低实验发现 WNT7A 沉默显著抑制细胞增殖和侵袭能力,表明 WNT7A 是参与细胞增殖和侵袭的新的 SE - associated 原癌基因,是 HNSCC 中有前景的预后生物标志物。    

5.SE 干扰对肿瘤生长的影响
在 HNSCC PDX 模型中,通过腹腔注射 JQ1 或 NEO2734 进行 SE 干扰,发现肿瘤体积减小,Ki - 67 染色减少,WNT7A 阳性染色也显著减少,表明 JQ1 和 NEO2734 可能通过 SE 干扰抑制 WNT7A 表达和体内肿瘤生长。

文章小结
文章通过对HNSCC的研究,成功构建了基于超增强子相关基因的预后模型SEAGS,验证了WNT7A功能及SE干扰对肿瘤影响,为治疗提供新思路,彰显了生信分析在癌症研究中的重要性,一套方法简单易复现,换个疾病模型,找小云帮你个性化设计吧~小云队提供高质量的生信分析以及课程服务。课程涵盖从数据挖掘到模型构建的全方位内容,帮助大家快速掌握核心技术!最近还在免费送课程哦,赶紧来挑选吧~

定制生信分析


云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

云生信学生物信息学
专注生信10余年,原创文章数千篇; 公号资料免费领,寻求服务找小云; 长期学习加关注,生信干货更不停。
 最新文章