【万能代码分享】一键搞定DEseq2差异分析、热图、火山图、GO分析、KEGG分析、GSEA分析等！

DESeq2是一个比较常用的转录组分析R包，包的使用非常简单，与之前的limma包不一样，DESeq2需要的数据是Row counts矩阵，这点非常重要。所以不管你自己的测序数据，还是GEO下载的数据，你需要明确是不是Row counts矩阵。比如我从GEO下载GSE169758的测序数据（我这里只是举例子），如下操作，打开生物医学之家网站（swyxzj.com）进入GEO官网：

检索GSE号，并且明确知道是测序数据，不是芯片数据：

点击下载raw count：

下载、解压，整理成下面（前面三个对照组，后面3个实验组）：

下面我们可以跑代码了。

二、运行代码：

将raw count矩阵和代码放在同一个文件夹下（RNAseq_Deseq2）：

打开代码，一共是7个步骤：

### 一、DEseq2差异分析+标准化PCA图### 二、ENSG转Symbol----公众号：科研部，参考链接：https://mp.weixin.qq.com/s/l3jgf_GhglZ5pwUNhc1x1g### 三、输出差异基因### 四、作图，差异表达图，热图，火山图### 五、差异基因集的GO分析### 六、差异基因集的KEGG分析### 七、 所有基因集的GSEA富集分析

第一步、差异分析+PCA降维：

如上代码，是3个对照组和3个实验组，所以你如果你的数据是7个，你就修改为7就行。之后，你会生成一个PCA图（感觉分组分的不好，这个数据有点问题）：

同时，生成DEseq2差异分析结果文件：

那我们根据PCA图可以看到有个别样本不行，错综复杂。意思就是这个数据不太好。那我们再换一个我自己的数据重新差异分析看看，数据如下：

读入数据，DEseq2差异分析（唯一要改的就是7个对照组，几个实验组）：

PCA看看分组如何：

分的很开，结果可靠。差异分析结果文件如下（但是是ENSG的，我们后续做GO、kegg、gsea都是需要基因symbol，所以下一步，我们要转换）：

二、ENSG转Symbol :

ENSG转symbol，请仔细看这篇推文（点击查看）。我们测序之后，比对到基因组文件的时候是用的哪个版本的GTF文件，你就需要下载该版本的GTF文件，用ENSGmap进去，得到基因Symbol，那我这里是自己测序的数据，用的是gencode.v39.文件，所以就下载1_gencode.v39.annotation.gtf.gz（怎么下载，请点击查看），放在这个文件夹下：

运行代码（你需要自己下载gtf文件，修改8：21的21，这个代码意思就是说取根据8-21列取每行的中位数，后面好比对到gtf文件时，同名的symbol处理，21的意思是7+n，n是样本数，我是14个样本，所以7+14=21）：

就得到了symbol的DEseq2分析结果文件（有symbol了）：

三、输出差异基因：

我这里取的阈值是logFC为1，矫正后的p值小于0.05，也就是变化倍数大于2，并且有统计学意义的基因作为差异基因，用于后续的分析，打开如下：

我们仔细看看后会发现，我们第二列里面有些也是ENSG号。

我们回到GTF文件看看：

发现有些ENSG基因，它的名字就是ENSG号，数量不多，不影响的。

四、作图，差异表达图，热图，火山图：

首先就是做热图，我们不可能将所有的差异基因都展示出来，所以这里筛选出padj < 0.05和abs(log2FoldChange) >2的基因拿出来做热图展示，就是说明有部分基因变化非常明显：

接着我们画火山图，说明很多基因确实发生了变化（蓝色和红色的基因有很多）：

第五步、差异基因集的GO富集分析：

我们要先加载差异基因文件，然后将其转化为entrezID：

我们发现TEC这个基因有多个entrezID：

这样我们后面用entrezID做GO分析的时候就会报错：错误: near "7006": syntax error。如下：

这个时候，我们就可以随机选取该基因的任何一个entrezID都行。

所以，最终的差异基因GO分析代码是：

这里是将P小于0.05的结果保留下来（万能代码，这一步，你什么都不需要改，后面的KEGG分析也是一样，不需要改）：

第六步、差异基因集的KEGG富集分析：

先输入差异基因，随后kegg富集分析，并保存P小于0.05的结果：

再选择P小于0.05的前10作图，并将KEGGmap到的通路下载下来：

产生结果文件：

第七步、所有基因集的GSEA富集分析：

是用所有基因来做GSEA富集分析，不是用差异基因哦，并且按照logFC排序进行GSEA富集分析，运行到下面代码：

P小于0.05的结果将会被保存起来：

然后把自己想要的通路（hsa号）画出来即可：

每一张都保存起来就行了，就等于一篇论文（你的数据有多新，你就能发多大的文章）：

最终的结果文件：

全套代码一共是300多行，自己多练练就会了，不会写不要紧，看得懂就行了，每一句代码都有注释。代码和演示数据我都上传了：

如下免费获取：

“Raw count的Deseq2包差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码（附代码交流群）”

如下免费下载：

🔽①长按下方二维码关注🔽

②对话框输入关键词：全套代码

更多免费资源：

三、科研绘图类：

21 更多资源在更新中.....

8 PS 2021 (Mac)安装包

四、生信和写作类：

辛苦整理，全文无任何广告！

觉得有用的话，您就点个在看、点赞!

http://mp.weixin.qq.com/s?__biz=MzI1NTY1MDM3MQ==&mid=2247514161&idx=3&sn=2b8aba36c6eec7d06e46d0238248d474

医学家网

医学、科研、资源汇集地，全部免费下载！

最新文章

院士，中国SCI杂志主编，被国际期刊终身禁稿

9988元药物靶点孟德尔随机化实操课免费送，不做实验发SCI：

7套生信分析与数据挖掘实操课（原价几万元）免费送！

PPT科研绘图VIP插件（永久版）免费送，分分钟搞定CNS。

GraphPad作各种图万能模板在此，输入数据，自动出图，简直太方便。

【实操课免费送】单细胞分析、ChIPseq、ATAC-seq、RNAseq等数据分析！

1万张Adobe Illustrator素材（无限高清、可编辑）免费送，小鼠、细胞、人体组织等都在这里了！

资源共享VIP会员群，点击进入！

突发！中山大学宋尔卫/苏士成团队Nature最新研究成果，被质疑！

2018-2024国自然标书全文+答辩PPT在此：

孟德尔随机化必备---芬兰数据库FinnGenR10所有数据一键下载，下载后可直接使用，不用任何修改：

2020-2023年，已中标的国自然标书全文免费下载啦！

一键得到所有lncRNA的泛癌分析结果，如差异表达、生存愈后等等，分分钟就是一篇SCI：

网络药理学视频课程（含课件）免费送！

科研8大软件免费送，永久免费使用，如GraphPad，Snapgene，AI，PS等：

资源共享VIP会员群，点击进入！

颜宁：讲讲如何记实验记录

2018-2024国自然标书全文+答辩PPT在此：

手把手教你单细胞+bulkseq联合去卷积分析，验证细胞群的存在：

文献表明：电泳液现配现用，转膜液可以用5次以上：

根据范文，手把手教你空间转录组数据分析：

Cell/science/nature插图素材库永久VIP免费送，可编辑，符合SCI投稿要求：

原价6988元转录组+免疫细胞+孟德尔联合分析发SCI实操课免费送！

资源共享VIP会员群，点击进入！

2024年度中国博士后科学基金第76批面上资助拟资助人员名单公示（医药类）

【万能代码分享】一键搞定DEseq2差异分析、热图、火山图、GO分析、KEGG分析、GSEA分析等！

手把手教你收集临床信息回顾性分析发SCI，不做实验：

手把手教你机器学习筛选疾病生物标志物：

各种实验小鼠插画，科研必备！

1万张Adobe Illustrator素材（无限高清、可编辑）免费送，小鼠、细胞、人体组织等都在这里了！

资源共享VIP会员群，点击进入！

2024年度中国医学院校，科研排行榜发布！

国自然杰青答辩PPT

【分子克隆万能模板】基因敲降、过表达、引物设计、定点突变、插入、缺失，CRISPR-Cas9基因敲除，一键搞定！

手把手教你用临床电子病历数据发SCI：

【实操】手把手教你孟德尔分析发一篇Nature：

手把手教你全套单细胞数据分析，附全套万能代码：

一万套Nature/Science/Cell插图素材永久VIP免费送啦！

资源共享VIP会员群，点击进入！

“拼妈式”学术不端？浙江大学最高层次奖学金本科生获得者与其教授母亲同发论文遭质疑！校方回应

2018-2024国自然标书全文+答辩PPT在此：

手把手教你单细胞+bulkseq联合去卷积分析，验证细胞群的存在：

文献表明：电泳液现配现用，转膜液可以用5次以上：

根据范文，手把手教你空间转录组数据分析：

Cell/science/nature插图素材库永久VIP免费送，可编辑，符合SCI投稿要求：

原价6988元转录组+免疫细胞+孟德尔联合分析发SCI实操课免费送！

资源共享VIP会员群，点击进入！

突发！科技部宣布：对短期内发表多篇论文的，必须核验！

“拼妈式”学术不端？浙江大学最高层次奖学金本科生获得者与其教授母亲同发论文遭质疑！校方回应

手把手教你组图投SCI：如何将Western Blot (WB) 条带对齐和水平校正？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉