【万能代码分享】一键搞定DEseq2差异分析、热图、火山图、GO分析、KEGG分析、GSEA分析等!

文摘   2024-11-07 21:34   美国  

热门免费资源:

一、国自然类:


1 1300份已中标标书全文

国自然项目答辩PPT

标书写作及参考文献模板

7 更多资源在更新中.....

2021历年国自然标书全文

国自然热点培训课

18-21年国自然中标清单

二、SCI实验类:

58套SCI实验操作视频

生物学实验操作手册

27款生物科研软件

qPCR计算万能模板

Excel统计分析模板

11 更多资源在更新中.....

69个SCI实验操作步骤

基因敲降shRNA实验步骤

近3年SCI实验资源汇总

Excel函数合集

10 SCI写作万能模板

三、科研绘图类:

PPT科研绘图素材合集

Office 正版软件安装包

直装版PS+AI安装包

PS修各种SCI实验图视频

资源共享群

PPT科研绘图插件VIP版

PPT/PS/AI科研绘图视频

Adobe全家桶安装包

PS 2021 (Mac)安装包

10 相亲交友群


今日推送
从2023年开始,如下,《关于向中国学术期刊(光盘版)电子杂志社领取学位论文稿酬的通告》,硕士学位论文可以领取60元人民币的现金稿酬,以及300元的阅读卡。而博士学位论文则可收到100元的人民币稿酬+价值400元的阅读卡


怎么体现稿费呢?访问地址https://au.cnki.net/author/degree

领取流程:本人账号登录→进行实名认证→认领本人学位论文→进行稿酬确认→提交提现申请→杂志社发放稿酬




前天,我们已经给大家分享了GEO芯片测序limma差异分析非配对的万能代码点击查看下载)。

昨天,我们已经给大家分享了GEO芯片测序limma差异分析配对的万能代码点击查看下载)。

我们也给大家免费分享了配对、非配对合并之后的万能代码(点击下载)那上面这些都是芯片测序(Array)的分析包。

那我们从GEO下载的或者我们自己测序的高通量测序(RNAseq)矩阵(Raw count。从下图我们可以看到公司给我们的一般是Raw count,或者FPKM/RPKM count,这个矩阵我们在发文章的时候一般需要上传到GEO或者TCGA):


因此,我们在挖掘GEO数据的时候,要么是Raw count矩阵,要么是FPKM/RPKM count矩阵。Raw count矩阵一般用Deseq2包进行差异分析FPKM/RPKM count矩阵一般用limma包差异分析。今天我们给大家分享的是Raw count的Deseq2包差异分析万能代码:

“Raw count的Deseq2包差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码(附代码交流群)”

如下免费下载:

🔽①长按下方二维码关注🔽

②对话框输入关键词:全套代码

②对话框输入关键词:全套代码

②对话框输入关键词:全套代码


是全套的万能代码,自动判断同基因名处理,你只要知道下载的数据有几个样本就行差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析,万能代码一键搞定。大家可以进群,群内不答疑,可代码共享。下面开始操作:

一、数据下载:

DESeq2是一个比较常用的转录组分析R包,包的使用非常简单,与之前的limma包不一样,DESeq2需要的数据是Row counts矩阵,这点非常重要。所以不管你自己的测序数据,还是GEO下载的数据,你需要明确是不是Row counts矩阵。比如我从GEO下载GSE169758的测序数据(我这里只是举例子),如下操作,打开生物医学之家网站(swyxzj.com)进入GEO官网:


检索GSE号,并且明确知道是测序数据,不是芯片数据:


点击下载raw count:


下载、解压,整理成下面(前面三个对照组,后面3个实验组):


下面我们可以跑代码了。

二、运行代码:

将raw count矩阵和代码放在同一个文件夹下(RNAseq_Deseq2):


打开代码,一共是7个步骤:

### 一、DEseq2差异分析+标准化PCA图### 二、ENSG转Symbol----公众号:科研部,参考链接:https://mp.weixin.qq.com/s/l3jgf_GhglZ5pwUNhc1x1g### 三、输出差异基因### 四、作图,差异表达图,热图,火山图### 五、差异基因集的GO分析### 六、差异基因集的KEGG分析### 七、 所有基因集的GSEA富集分析

第一步、差异分析+PCA降维:


如上代码,是3个对照组和3个实验组,所以你如果你的数据是7个,你就修改为7就行。之后,你会生成一个PCA图(感觉分组分的不好,这个数据有点问题):



同时,生成DEseq2差异分析结果文件:



那我们根据PCA图可以看到有个别样本不行,错综复杂。意思就是这个数据不太好。那我们再换一个我自己的数据重新差异分析看看,数据如下:


读入数据,DEseq2差异分析(唯一要改的就是7个对照组,几个实验组):


PCA看看分组如何:


分的很开,结果可靠。差异分析结果文件如下(但是是ENSG的,我们后续做GO、kegg、gsea都是需要基因symbol,所以下一步,我们要转换):


二、ENSG转Symbol :

ENSG转symbol,请仔细看这篇推文(点击查看)。我们测序之后,比对到基因组文件的时候是用的哪个版本的GTF文件,你就需要下载该版本的GTF文件,用ENSGmap进去,得到基因Symbol,那我这里是自己测序的数据,用的是gencode.v39.文件,所以就下载1_gencode.v39.annotation.gtf.gz(怎么下载,请点击查看),放在这个文件夹下:


运行代码(你需要自己下载gtf文件,修改8:21的21,这个代码意思就是说取根据8-21列取每行的中位数,后面好比对到gtf文件时,同名的symbol处理,21的意思是7+n,n是样本数,我是14个样本,所以7+14=21):


就得到了symbol的DEseq2分析结果文件(有symbol了):


三、输出差异基因:


我这里取的阈值是logFC为1,矫正后的p值小于0.05,也就是变化倍数大于2,并且有统计学意义的基因作为差异基因,用于后续的分析,打开如下:


我们仔细看看后会发现,我们第二列里面有些也是ENSG号。



我们回到GTF文件看看:


发现有些ENSG基因,它的名字就是ENSG号,数量不多,不影响的。

四、作图,差异表达图,热图,火山图:

首先就是做热图,我们不可能将所有的差异基因都展示出来,所以这里筛选出padj < 0.05和abs(log2FoldChange) >2的基因拿出来做热图展示,就是说明有部分基因变化非常明显:


接着我们画火山图,说明很多基因确实发生了变化(蓝色和红色的基因有很多):


第五步、差异基因集的GO富集分析:

我们要先加载差异基因文件,然后将其转化为entrezID:


我们发现TEC这个基因有多个entrezID:


这样我们后面用entrezID做GO分析的时候就会报错:错误: near "7006": syntax error。如下:


这个时候,我们就可以随机选取该基因的任何一个entrezID都行。


所以,最终的差异基因GO分析代码是:


这里是将P小于0.05的结果保留下来(万能代码,这一步,你什么都不需要改,后面的KEGG分析也是一样,不需要改):


第六步、差异基因集的KEGG富集分析:

先输入差异基因,随后kegg富集分析,并保存P小于0.05的结果:


再选择P小于0.05的前10作图,并将KEGGmap到的通路下载下来:


产生结果文件:


第七步、所有基因集的GSEA富集分析:

是用所有基因来做GSEA富集分析,不是用差异基因哦,并且按照logFC排序进行GSEA富集分析,运行到下面代码:


P小于0.05的结果将会被保存起来:


然后把自己想要的通路(hsa号)画出来即可:


每一张都保存起来就行了,就等于一篇论文(你的数据有多新,你就能发多大的文章):


最终的结果文件:


全套代码一共是300多行,自己多练练就会了,不会写不要紧,看得懂就行了,每一句代码都有注释。代码和演示数据我都上传了:


如下免费获取:


Raw count的Deseq2包差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码(附代码交流群)
如下免费下载:

🔽①长按下方二维码关注🔽

②对话框输入关键词:全套代码

②对话框输入关键词:全套代码

②对话框输入关键词:全套代码

更多免费资源:

三、科研绘图类:

PPT科研绘图素材合集

Office 正版软件安装包

直装版PS+AI安装包

PS修各种SCI实验图视频

AI科研绘图素材合集

11 AI科研绘图视频

13 SPSS统计分析实操课程

15 Origin绘图最全教程

17 Graphpad绘图视频

19 Image J图片处理视频

21 更多资源在更新中.....

PPT科研绘图插件VIP版

PPT/PS/AI科研绘图视频

Adobe全家桶安装包

PS 2021 (Mac)安装包

10 AI 2021安装包及素材

12 30 GB科研作图资源

14 Origin2021软件+教程

16 GraphPad绘图最全模板

18 Stata统计分析视频

20 Sigma plot绘图软件和视频

四、生信和写作类:

15套生信实操课程

TCGA数据挖掘课

零代码复现6分SCI教程

零代码复现4分SCI教程

WGCNA分析课程

11 GO分析傻瓜式教程

13 GSEA分析傻瓜式教程

15 渐变火山图傻瓜式教程图

17 GEO+TCGA数据挖掘课

19 41GB的生信分析+实验资源

GEO数据挖掘课

200篇生信自学范文

零代码复现5分SCI教程

8分SCI零代码复现步骤

10 超全生信数据库使用教程

12 KEGG富集分析教程

14 Meta分析范文+实操课

16 交集基因筛选高级教程

18 生信软件合集

辛苦整理,全文无任何广告!

觉得有用的话,您就点个在看、点赞!

科研部
由哈佛医学院及国内高校硕博们创办,一个共享临床论文、科研实验、生信挖掘、雅思托福等资源的平台!
 最新文章