“泼天富贵”降临诺奖“机器学习”!复旦中山医院神操作,101种机器学习算法+多组学,纯靠软件分析就能搞定Ⅰ区top!

文摘   2024-11-03 18:02   上海  

这两天最热门的探讨话题应该就是24年诺贝尔物理和化学都双双花落人工智能(AI)了。
初看结果确实有点让人意外,但是对我们做生信的人来讲,这绝对是重大利好,能显著的提高“AI”的影响力和认可度。
机器学习(ML)(包括深度学习等)是AI的核心分支。大海哥也挺激动,之前推荐了不少“机器学习”的思路,现在有了诺奖的加持,想必大家也都更加认可了!所以咋也趁热打铁,今天就分享一篇机器学习的“黑科技”文章~
这篇是由复旦大学附属中山医院团队发表在9.1分Cancer Letters上的经典之作,文章是利用机器学习方法,构建DNA损伤修复(DDR)指数,用于肝细胞癌的靶点筛选和预后评估。其有如下亮点:
1,10种机器学习方法的101种算法组合应用:常见的机器学习应用文章,使用3-5种算法,甚至只要一种。但是作者将RSF、LASSO、CoxBoost、StepCox这些具备降维和变量筛选功能的算法作为第一步,与其他算法组合起来,于是产生了101种不同的机器学习算法组合,在关键基因的识别中提供了极大的帮助。也能给小伙伴带来更多的参考和学习价值。按文献所述,这些算法共包括如下类型,小伙伴各取所需:Random Survival Forest (RSF), Elastic Net (Enet), Lasso, Ridge, Stepwise Cox, CoxBoost, Cox Partial Least Squares Regression (plsRcox), Supervised Principal Component (SuperPC), Generalized Boosted Regression Model (GBM), Survival Support Vector Machine (survival-SVM)等;    
2,利用单细胞及多组学公共数据,成功解码DNA损伤修复(DDR)如何影响肝细胞癌(HCC)肿瘤微环境,探索了未来的潜在治疗策略。又是多组学分析,又是机器学习,这擦出来的“火花”可是不一般的耀眼,直接轻松拿下Top期刊。而且还是纯分析,0实验,实在是太香了。
该研究有相当大的应用价值,里面涉及的多组学分析和机器学习都极力推荐大家进行系统的学习哦。(PS:看到这,是不是非常期盼自己也能开发新的机器学习框架?有梦想就对了,多组学分析、机器学习都是大海哥的拿手绝活,想要复现本文思路,我们通通帮你全搞定,还不快来滴滴大海哥,有惊喜在等着你哦!)


定制生信分析

云服务器租赁

加微信备注99领取使用


l题目:通过深度转录组分析解码肝细胞癌的免疫调节和DNA损伤修复模式的治疗意义
l杂志:Cancer Letters
l影响因子:IF=9.1
l发表时间:20242
研究背景
DNA损伤修复(DDR)在肝细胞癌(HCC)中扮演着关键角色,影响免疫治疗的效果。尽管已有一线治疗药物,但受益患者有限。本研究利用多组学分析和机器学习算法,创建了基于单细胞测序数据的DDR评分框架,揭示了DDR与肿瘤微环境(TME)的相互作用,为HCC患者提供了更精准的治疗策略。    
数据来源     

 

研究思路
作者通过预处理单细胞RNA测序数据,开发了一种算法来评估恶性细胞的DNA损伤修复(DDR)状态,并用优势比(Odds Ratios, ORs)分析细胞类型分布。进一步,他们利用RNA测序和机器学习技术,创建了DDR评分系统(DDRscore),这有助于预测肝细胞癌(HCC)患者的总体生存率和对PD-1疗法的抵抗性。研究还探讨了DDR在HCC免疫调节中的作用,以及DDR评分在预测治疗反应和患者预后中的应用潜力。    
研究结果
1.肝癌恶性细胞的DDR异质性分析
作者运用bulk RNA-seq和scRNA-seq数据,结合101种机器学习算法,深入分析了肝细胞癌(HCC)的细胞群。通过特定标记基因对细胞进行注释,发现上皮和免疫细胞在正常与癌组织间存在显著异质性。利用CopyKAT算法,从大量样本中提取出9957个恶性细胞,并观察到这些细胞根据病理阶段形成不同的群集。进一步通过hdWGCNA分析,鉴定了19个基因模块,筛选出3230个关键基因,其中56个参与DDR过程,为理解肿瘤进展提供了新视角。
    
1  恶性细胞中的DDR异质性
2.不同DDR条件下HCC中TME生态系统的不同概况
作者基于患者DDR状态将肿瘤微环境分为“高DDR”和“低DDR”两组。通过优势比分析,发现自然杀伤(NK)细胞与“低DDR”组关联最强。NK细胞聚类分析揭示六个亚群,以GSTA1+和IGLC3+ NK细胞为主的“高DDR”组。
 2  使用单细胞RNA测序(scRNA-seq)分析不同DDR水平下肝细胞癌(HCC)肿瘤微环境
3.免疫检查点阻断后高DDR介导免疫抑制特点分析
作者利用“TransferData”算法,成功地从单细胞分析数据中推断出细胞类型并进行了注释。通过比较接受免疫治疗和未接受免疫治疗的患者,发现前者的CD8+T细胞数量较多。通过UMAP降维和聚类分析,揭示了不同样本中恶性细胞的异质性。DDRscore算法的开发,进一步探索了不同DDR状态下的免疫表型组成,发现“低DDR”组中脂肪酸代谢途径、WNT途径和可能的致癌MYC途径被激活,为HCC治疗提供了新的视角。
3 免疫治疗阻断介导的DDR免疫微环境特征
4.DDR共识特征预测HCC预后和免疫治疗反应性
作者利用留一法交叉验证(LOOCV)框架,结合101种机器学习算法,开发了DDR评分模型。通过计算每个模型的C指数,筛选出最佳的预测模型(Lasso + 随机生存森林,RSF)。应用此模型,研究发现“高DDR”患者的总体生存率(OS)显著低于“低DDR”组,表明“低DDR”的HCC患者在生存方面具有益处。    
4使用批量测序数据和机器学习方法的组合开发并验证了共识DDRscore
文章小结
总之,本文算是“机器学习”在临床中的经典应用,进行诊断、预后模型的构建。基于101种机器学习算法组合、单基因数据和DDRscore系统开发等创新点,成功实现0实验纯分析斩获1区9分+期刊,实属人生赢家。相信这也是我们苦苦追寻的那种“纯生信”研究。101种机器学习算法组合是真的豪横,0实验纯生信就是要这么做,小伙伴们好好学学吧!想趁着诺奖这波东风,在机器学习上吃一波红利,就得赶紧动手了!如果想复现本文思路,抓紧联系大海哥哦。


医学海公众号持续为大家带来最新科研思路,想复现这种思路或者定制更多创新性思路欢迎直接call大海哥,竭诚为您的科研助理!


最新热点思路

文献思路复现

创新思路设计

服务器租赁

往期推荐

我缺的是Nat Commun吗?我缺的是撬动它的王炸思路!暨南大学团队:微生物组+代谢组学+转录组,这热点把握度,绝了!

超绝思路新鲜出炉!直接平地起高楼?准备好迎接国立成功大学林世杰团队“铁死亡+线粒体”把“毛坯”秒变“精装”的科研震撼吧!

震惊!只研究1种交互作用就拿到21分+?快进来学最严谨的交互作用分析方法


医学海
实用医学学术平台:专注分享生物医学方向最新热点研究,高分思路分享
 最新文章