## tinyarray包可用于多样本的差异分析
#1.获取数据
gse = "GSE7476"
geo = geo_download(gse)
#2.分组信息
Group = c(rep("CTRL",times = 3),
rep("TaGL",times = 3),
rep("T1GH",times = 3),
rep("T2-4",times = 3))
Group = factor(Group,levels = c("CTRL","TaGL","T1GH","T2-4"))
#3.探针信息
library(tinyarray)
# find_anno(gpl_number)
ids <- AnnoProbe::idmap('GPL570')
ids = ids[!duplicated(ids$symbol),] #去除ids中重复的探针
dcp = get_deg_all(geo$exp,Group,ids,symmetry = T,logFC_cutoff = 1 ,cluster_cols = F,entriz = F)
dcp$plots
在实际操作过程中,只需要更改GSE序列号,GPL平台号和分组信息,就可以实现对GEO芯片数据和常规转录组测序数据的快速分析。GSE7476是我们经常使用的示例数据,文章2009年发表在Journal of Urology杂志,题为DNA microarray expression profiling of bladder cancer allows identification of noninvasive diagnostic markers。
Journal of Urology是泌尿学与肾脏学领域期刊,是美国泌尿外科协会AUA的官方期刊,涵盖广泛的泌尿学领域,包括:泌尿肿瘤学、肾移植以及男性不育等泌尿系统常见疾病。该期刊属于JCR1区,中科院1区top;可选择OA模式,免审稿费;审稿周期约73天左右;自引率低!不过,该期刊似乎更倾向于临床试验研究,对生信论文不友好。
从自行分析和文章展示的结果来看,这个芯片数据的质量还是不错的。为什么质量高呢?肿瘤和非肿瘤样本:分别聚类,界限明确;热图表达谱可以看到表达特征组内相似,组间相异;PCA区分别聚类。推荐相关专业的果友,用该数据集进行二次数据挖掘。