【万能代码分享】一键搞定Limma包配对/非配对差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析!

文摘   2024-11-14 21:52   美国  

热门免费资源:

一、国自然类:


1 1300份已中标标书全文

国自然项目答辩PPT

标书写作及参考文献模板

7 更多资源在更新中.....

2021历年国自然标书全文

国自然热点培训课

18-21年国自然中标清单

二、SCI实验类:

58套SCI实验操作视频

生物学实验操作手册

27款生物科研软件

qPCR计算万能模板

Excel统计分析模板

11 更多资源在更新中.....

69个SCI实验操作步骤

基因敲降shRNA实验步骤

近3年SCI实验资源汇总

Excel函数合集

10 SCI写作万能模板

三、科研绘图类:

PPT科研绘图素材合集

Office 正版软件安装包

直装版PS+AI安装包

PS修各种SCI实验图视频

资源共享群

PPT科研绘图插件VIP版

PPT/PS/AI科研绘图视频

Adobe全家桶安装包

PS 2021 (Mac)安装包

10 相亲交友群


一键搞定GEO芯片测序
前天,我们已经给大家分享了GEO芯片测序limma差异分析非配对的万能代码点击查看下载)。

昨天,我们已经给大家分享了GEO芯片测序limma差异分析配对的万能代码点击查看下载)。

那我们将配对、非配对合并成万能代码,所以,今天,我们给大家分享的是:

“Limma包配对/非配对差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码(附代码交流群)”

如下免费下载:

🔽①长按下方二维码关注🔽

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码



是全套的万能代码,自动判断是否需要log2转换,自动ID转换,自动同基因名处理,你只要知道下载的数据有几个样本就行差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析,万能代码一键搞定。大家可以进群,群内不答疑,可代码共享。下面开始操作:

一、数据下载:

数据下载和GPL平台文件就不说了,前面两篇推文写的非常清楚了(点击查看)

二、运行代码:

我们下载好series_matrix探针矩阵文件之后,将开头和最后一行的行删掉,并修改文件名为input【1_input.txt】(对于任何的探针矩阵,你都可以处理成这样行名是探针名,列名是GSM样本名,我们这里是18比18,共36个样本,我会教大家非配对差异分析+配对差异分析),作为我们此次分析的输入文件,并和GPL文件【1_PlatformMap.txt】代码文件【0_GEO_limma(配对+非配对).R】放在一个文件夹下:


万能代码运行之后,你会得到所有的结果:


差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析,万能代码一键搞定。

“Limma包配对/非配对差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码(附代码交流群)”

如下免费下载:

🔽①长按下方二维码关注🔽

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码


这个代码,一共需要你修改18个地方,零基础,教会你理论+实操。下面看我来演示:

探针矩阵【1_input.txt】,GPL平台文件【1_PlatformMap.txt】和代码文件【0_GEO_limma(配对+非配对).R】放在一个文件夹下,input矩阵是行名是探针名,列名是GSM样本名,我们这里是18比18,共36个样本,打开如下,


平台文件是我们自己整理的,网上也有很多可以下载,大家也可以自行下载,里面是平台GPL和需要的ID转换R包一一对应,告诉我们哪个GPL平台用哪个R包去进行ID转换:



打开代码:


代码一共分为10个步骤:

### 1.读入探针矩阵数据--公众号:科研部### 2.数据预处理:NA去除+log2转换+样本芯片矫正### 3.探针ID和基因名symbol转换### 4.基因Symbol表达矩阵获取:探针矩阵转换为基因Symbol矩阵+同名symbol保留表达量的最大值。### 5.使用limma包来做芯片的差异分析(非配对)------选一个就行### 5.使用limma包来做芯片的差异分析(配对)------选一个就行### 6.输出差异基因### 7. 作图,差异表达图、热图、火山图### 8. 差异基因集的GO分析### 9. 差异基因集的KEGG分析### 10. 差异基因集的GSEA富集分析

第零步,添加镜像,免得后面安装R包报错:


第一步,读入探针矩阵:

读入:


点击看一下矩阵:


恩,OK,这个时候我们注意,行名是探针的ID,后面我们要进行ID转换,将探针的ID转换成基因的Symbol。那这里进行下一步。

第二步,表达矩阵预处理:

首先是将探针矩阵赋值给ex矩阵,随后NA去除+log2转换后,看看样本间芯片怎么样(样本间差异需要去除):


不平,我们需要矫正(不管前面平不平,都可以进行矫正处理),矫正之后平了:



第三步,探针ID和基因名Symbol转换:

输入GPL6102探针平台(每一个测序GSE都有对应的GPL平台,不知道的去看我推文开头说到的两篇推文,都有说),看看该探针ID是用什么R包将探针ID转换成基因symbol的,这里是illuminaHumanv2.db(万能代码第1处需要你改的地方,就是输入平台号)。


那么,我们就需要下载该包、加载该illuminaHumanv2.db万能代码第2、3处需要你改的地方,就是安装加载该包


那加载之后,不知道用这个包里面的什么函数将探针ID转换成,就在右下角搜索:


这里可以看到是illuminaHumanv2SYMBOL函数会变成Symbol万能代码第4处需要你改的地方,就是输入对应的函数


运行代码:


发现我们的制作probe2symbol转换文件建立成功,打开看看(建立成功之后,我们就要进行真正的转换了):


第四步、 基因Symbol表达矩阵获取:

一个基因会对应对个探针,有些基因名称会是重复的,这些都需要处理。对于多个探针,我们选取在样本中平均表达量最高的探针作为对应基因的表达量。一下代码完成所有事情,而且可以复用。



转换成功,打开看看,此时行名已经是基因symbol了,我们可以继续差异分析了:


我们可以看到探针矩阵ex里面有48701行,而转换后的exprset基因symbol矩阵有18944行,减少了很多没用的探针,或者由于一个探针注释到同一个基因名的原因。

第五步、使用limma包来做芯片的差异分析---非配对差异分析:

首先就是分组,分组之后用PCA从转录组水平的维度来分析,看看分组怎么样,是否两组分的很开,能否进行后续的差异分析万能代码第5处需要你改的地方,就是输入对应的样本数


我们可以看到其实,有个别样本分的不好(807370不好感觉),应该要在input文件里面将这个样本删除才行的,这里我们不删除,继续给大家演示,那大家自己做分析的时候,看到分组不好,就要回到第一步,将input里面的807370这一列删除后再继续读入

非配对limma差异分析,我们可以看到差异分析之后,adj.P小于0.05的有6793个(allDiff=topTable(fit2,adjust='fdr',coef=2,number=Inf, p.value=0.05)#把,此处的P是adj.P,p.value=0.05删掉就是所有的分析结果):


第五步、使用limma包来做芯片的差异分析---配对差异分析:

那如果你的数据是配对的,你就运行这个第五步,不要运行前面的哪个第五步了,如下:

一样的,还是先分组:


随后limma配对差异分析,并保存结果:


一共是7633个,用我们之前的Limma包非配对的差异分析代码,结果就是有allDiff得到6799行。所以,不配对和配对还是有差异的。

那我这里就用配对的继续演示吧(反正你们自己选一个第5步就好):

第六步、筛选差异基因:

我这里是adj.P.Val < 0.05和abs(logFC) >0.5为阈值,要记住这个基因集,我们后面就用来做GO\KEGG分析了。(自己需要修改的6、7处代码)


结果文件里面有P、logFC、还有具体的表达矩阵,方便我们做实验的时候挑选合适的分子,P小的,logFC变化大的,矩阵对照组很低,实验组很高的,这样子去挑选:



第七步,作图。

做某一个基因的图(第8处改,自己想看哪个基因就改成哪个基因的名字):


9、10改也是一样,想看谁改成谁:



接着画一些基因的热图(选取一群adj.P.Val < 0.05和abs(logFC) >1的差异基因做热图,如果你的基因很多,你就缩小一下这个阈值,如果你的基因很少,你就放大一下这个阈值,第11、12、13处就是这样改),:



记得把图片保存为eps格式(后期用AI组图):


接着我们画火山图(分别是logFCfilter = 0.5### 筛选标准和logFCcolor = 1### 筛选标准对应的两种阈值,你自己想怎么画就改成什么阈值就行):


第八步,差异基因集的GO富集分析:

这里,我们导入我们之前保存的adj.P.Val < 0.05和abs(logFC) >0.5为阈值的差异基因,做GO分析:


结果,这里是给你自动保存了P小于0.05的富集结果,而不是adj.P:


第九步,KEGG分析:


结果如下:


第十步、GSEA富集分析:

GSEA富集分析跟GO、KEGG分析不一样,GO、KEGG是做的差异基因,GSEA做的是所有基因,意义不一样。


运行之后打开结果看看(P小于0.05的结果):


然后,自己将自己感兴趣的结果可视化出来:


这样,我们全套就搞定了,基本上,代码都是万能的了,要改的参数非常少,就算有,里面也写的非常清楚,0基础就能看懂。16、17、18需要改的地方如下:


代码和演示数据我都上传了:


如下免费获取:


“Limma包配对差异分析+热图+火山图+GO分析+KEGG分析+GSEA分析全套万能代码(附代码交流群)
如下免费下载:

🔽①长按下方二维码关注🔽

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码

②对话框输入关键词:配对非配对代码



更多免费资源:

三、科研绘图类:

PPT科研绘图素材合集

Office 正版软件安装包

直装版PS+AI安装包

PS修各种SCI实验图视频

AI科研绘图素材合集

11 AI科研绘图视频

13 SPSS统计分析实操课程

15 Origin绘图最全教程

17 Graphpad绘图视频

19 Image J图片处理视频

21 更多资源在更新中.....

PPT科研绘图插件VIP版

PPT/PS/AI科研绘图视频

Adobe全家桶安装包

PS 2021 (Mac)安装包

10 AI 2021安装包及素材

12 30 GB科研作图资源

14 Origin2021软件+教程

16 GraphPad绘图最全模板

18 Stata统计分析视频

20 Sigma plot绘图软件和视频

四、生信和写作类:

15套生信实操课程

TCGA数据挖掘课

零代码复现6分SCI教程

零代码复现4分SCI教程

WGCNA分析课程

11 GO分析傻瓜式教程

13 GSEA分析傻瓜式教程

15 渐变火山图傻瓜式教程图

17 GEO+TCGA数据挖掘课

19 41GB的生信分析+实验资源

GEO数据挖掘课

200篇生信自学范文

零代码复现5分SCI教程

8分SCI零代码复现步骤

10 超全生信数据库使用教程

12 KEGG富集分析教程

14 Meta分析范文+实操课

16 交集基因筛选高级教程

18 生信软件合集

辛苦整理,全文无任何广告!

觉得有用的话,您就点个在看、点赞!

科研部
由哈佛医学院及国内高校硕博们创办,一个共享临床论文、科研实验、生信挖掘、雅思托福等资源的平台!
 最新文章