为方便学习我们单细胞课程的学员利用我们提供的脚本快速的分析公共数据做数据挖掘,这里开始记录一下不同公共数据相关分析shell代码。大家有了我们的代码就可以照抄分析,提高分析数据效率,今天是第1个数据,后续还有数据慢慢给大家分享:
数据介绍:GSE192575
来自谷歌翻译:
基于顺铂的化疗是不可切除膀胱癌最常见的治疗方法,并且也越来越多地用作手术和放疗之前或之后的新辅助治疗。不幸的是,尽管许多患者对治疗有反应,但大多数患者很快就会产生耐药性,机制尚不清楚,而且很少有进一步的治疗选择。在这里,我们报告说,小鼠和人类在化疗过程中都会获得半鳞化。多组学分析表明,p63 的直接靶点组织蛋白酶 H (CTSH) 与化疗耐药和半鳞状化相关。使用组织蛋白酶抑制剂 E64 治疗可以特异性抑制化疗耐药性癌症,但不能抑制化疗敏感性癌症。从机制上讲,组织蛋白酶抑制可诱导膀胱癌细胞完全鳞状分化,这需要 TNF 受体 1α,并与细胞焦亡相关。我们的研究表明,半鳞状化将是化疗耐药的诊断标志物,而针对 CTSH 的分化治疗可能是化疗耐药膀胱癌的潜在治疗方法。
GEO单细胞数据地址:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE192575
数据下载与准备:
wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE192575&format=file" -O GSE192575_RAW.tar
tar xvf GSE192575_RAW.tar
选择人的数据解压:
tar zxvf GSM5751918_human_Res.tar.gz
tar zxvf GSM5751918_human_Sen.tar.gz
运行完以上代码结果目录如下:
单细胞分析代码:
这里是标准的10X的数据,所以用--data.dir参数直接读入数据:
#读入数据1
Rscript $scripts/seurat_sc_qc.r --data.dir human_Res --project BLCA_GSE192575-Res \
--nUMI.min 500 \
--nUMI.max 50000 \
--nGene.min 250 \
--mito.gene.pattern "^MT.*-" \
--percent_mito 25 \
--log10GenesPerUMI 0.7 \
-o BLCA_GSE192575/01.qc-Res -p GSE192575 \
--metadata.col.name Batch --metadata.value Res
#读入数据2
Rscript $scripts/seurat_sc_qc.r --data.dir data/GSE192575/human_Sen/ --project BLCA_GSE192575-Sen \
--nUMI.min 500 \
--nUMI.max 50000 \
--nGene.min 250 \
--mito.gene.pattern "^MT.*-" \
--percent_mito 25 \
--log10GenesPerUMI 0.7 \
-o BLCA_GSE192575/01.qc-Sen -p GSE192575 \
--metadata.col.name Batch --metadata.value Sen
#合并数据
Rscript $scripts/merge_seurat_obj.r -i BLCA_GSE192575/01.qc-Res/GSE192575.afterQC.rds \
BLCA_GSE192575/01.qc-Sen/GSE192575.afterQC.rds \
-o BLCA_GSE192575/02.merge -p GSE192575
#降维聚类
Rscript $scripts/seurat_sc_cluster.r --rds BLCA_GSE192575/02.merge/GSE192575.rds \
-p GSE192575 --resolution 0.5 -d 30 \
-o BLCA_GSE192575/03.cluster \
--vars.to.regress nUMI percent_mito \
--high.variable.genes 2000 --integrate.method harmony \
--batch.id Batch
结果展示:
单细胞转录组分析课程推荐:https://bdtcd.xetslk.com/s/4i88K6