热点基因集生信分析四种起手式,你肯定不知道

学术   科学   2024-10-29 06:57   北京  

书接上回


提到利用临床表型数据库计算相关性,然后孟德尔随机计算因果之后,再利用生物信息分析进行机制的探究和挖掘。

目前还不需要很复杂的挖掘,对于感兴趣的基因集,之前小编介绍过两种分析路线。


小编把话放在这哈,这个思路,仍旧是干湿结合发文章,申请课题的最优的方案。(钱少事少内容多)


今天有三种给大家推荐下。


一、lasso+cox

第一个就是之前反反复复,复复反反推荐过的技术路线,主要用于基因数量比较多的情况下,比如铁死亡基因集。数量较多,从数据流动性上看,存在降维的可能性,后续存在被实验验证的可能性。


Ref:Front Immunol IF:7.3 2022


二、一致性聚类+差异分析+lasso+cox

如果说lasso+cox是针对基因集多的情况,那么这个一致性聚类针对的就是基因集比较少的情况,基因数量少。可能的原因在于目前的基因并不是全部,可能受限于某种实验手段,所以我们需要对基因集进行有效的拓展。比较常见的就是利用较少的基因集做一致性聚类,然后差异分析。比如研究铜死亡,这样拓展之后就只能叫做铜死亡related 基因了。但是基因数量得到拓展,后续分析也就游刃有余。


Ref:Front Immunol IF:7.3 2022


三、一致性聚类+差异分析+相关性

第三种就是上面第二种的变形,如果说第二种筛选完差异太多,或者lasso降维之后效果并不明显,无法将它控制在某一个空间的话,可以采用WGCNA来叠加一层buff,这样通过关联下表型,可以添加一层筛选,这样的话。你的基因集名字还得改下哈,比如年龄相关的铁死亡related基因。这种带来的好处是问题更聚焦,流动性会更好。


Ref:Front Neurosci IF 4.3 2022


四、单细胞+差异分析+lasso+cox

最后一种,我之前没见过。24年发表的,这种做法虽然有点粗糙,但是优化下还是可以选择的。


文章研究的是Treg相关的基因,如果是按照上面的逻辑,就是直接检索对应的基因,或者一致性聚类再筛选。但是文章是利用三套单细胞数据进行分析,将Treg群跟其他的免疫细胞群体做差异分析,筛选出来的基因都做为Treg 相关的基因,可不可以。当然可以。


这种做法很像一致性聚类的升级版。而且给人一种耳目一新的感觉。这种方法上的创新,可以关注下。当然如果要发高分的话,这里需要进行优化哈。


Ref:aging-us IF:4 2024


以上四种起手式,希望大家在自己课题申请,科研经历中多多使用下,不用一条路走到黑。要知道条条大路通罗马。


更贴合临床的生信分析定制


往期热点 (点击标题跳转)

01

肿瘤免疫逃逸新机制

02

孟德尔随机化

03

生信+实验结合

04

单细胞空间转录组

05

肿瘤相关巨噬细胞(TAM)

06

细胞死亡

07

耐药



文章转载请联系 | 15510012760(微信)

喜欢的话,点个「在看」,分享给身边好友~

生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章