单细胞转录组数据挖掘流程记录-BRCA乳腺癌(E-MTAB-8107)

文摘 2024-07-22 09:33 北京

这个数据的表达量来自一篇泛癌文章，里面有很多项目的数据，其中就有这个数据，我们可以从中分离出来（GSE210347）：

文章地址PanCAF :https://www.nature.com/articles/s41467-022-34395-2

数据下载：

wget -c  https://ftp.ncbi.nlm.nih.gov/geo/series/GSE210nnn/GSE210347/suppl/GSE210347%5Fcounts.Rds.gz -O GSE210347_counts.Rds.gzwget -c https://ftp.ncbi.nlm.nih.gov/geo/series/GSE210nnn/GSE210347/suppl/GSE210347%5Fmeta.txt.gz -O GSE210347_meta.txt.gzwget -c https://ftp.ncbi.nlm.nih.gov/geo/series/GSE210nnn/GSE210347/suppl/GSE210347%5Fstudy%5Fmetadata.xls.gz -O GSE210347_study_metadata.xls.gz
#合并两个表格按sample ID合并，注意保存txt格式Rscript $scripts/merge_tsv_files.r -i GSE210347_meta.txt GSE210347_study_metadata.tsv -b SampleID -p metadata_all
#筛选乳腺癌数据的metadatacat metadata_all.tsv |awk 'NR==1|| ($0~"E-MTAB-8107" && $0~/Breast/){print $0}'>E-MTAB-8107_BRCA_metadata.tsv

数据分析：

会根据metadata数据筛选乳腺癌数据：

Rscript $scripts/seurat_sc_qc.r  --rds GSE210347_counts.Rds  --project BRCA_E-MTAB-8107  \    --nUMI.min 500 \    --nUMI.max 50000 \  --nGene.min 250 \  --mito.gene.pattern "^MT.*-" \  --percent_mito 20 \  --log10GenesPerUMI 0.8 \  -o 01.qc -p BRCA_E-MTAB-8107  --metadata E-MTAB-8107_BRCA_metadata.tsv

Rscript $scripts/seurat_sc_cluster.r --rds 01.qc/BRCA_E-MTAB-8107.afterQC.rds  \ -p BRCA_E-MTAB-8107  --resolution 0.5  -d 30 -o 02.cluster \ --vars.to.regress nUMI  percent_mito --high.variable.genes 2000

结果：

生信课堂

生信笔记

最新文章

如何使用dd拷贝系统盘

组装"预实验" | 物种倍性分析

IF=4.3 | 秋茄树SOS1基因家族分析

FUSION做TWAS分析

linux三剑客之grep-文件中的信息搜索

IF=13.8 | 青藏高原人群肠道微生物生物标志物的荟萃分析及微生物群衍生的丁酸盐在高海拔适应中的功能

WGCNA分析 | 结果解读

R语言绘制转录组多组差异基因展示

IF=4.6 | 蛋白质组学分析揭示白藜芦醇的抗菌机制

TWAS分析的原理和工具

IF=13.8 | 甘油/二醇脱水酶是后肠发酵食肉动物肠道微生物群的关键功能

核苷酸多样性π的计算

R语言绘制差异表达火山图

eQTL分析之协变量计算

几种基因型数据的转换

IF=4.9 | 多倍体割手密IAA基因家族分析鉴定

R语言基础入门—数据结构（2）

DockerHub镜像无法下载的解决方案

单细胞转录组-RNA速率（RNA velocity）分析原理与结果解读

如何预测CpG岛

空间转录组数据读取

用R包——MatrixEQTL做eQTL分析

IF=5.7 | 转录组数据揭示类风湿关节炎的临床诊断模型

R语言基础入门—数据结构（1）

空间转录组数据预处理

R语言基础入门—R语言概述与安装！

单细胞转录组课程更新

单细胞转录组数据挖掘流程记录-BLCA膀胱癌(GSE192575)

单细胞转录组数据挖掘流程记录-BRCA乳腺癌(E-MTAB-8107)

单细胞转录组数据挖掘流程记录-BRCA乳腺癌(GSE161529)

单细胞转录组数据挖掘流程记录-CRC直肠癌(GSE178341)

给进化树标定化石时间

组装"预实验" | 基因组调研图

序列的提取和截取

蛋白质组学质谱数据搜库分析 | MaxQuant软件的使用

单细胞转录组-cellchat细胞通讯结果解读

单细胞转录组数据挖掘流程记录-BLCA膀胱癌(GSE192575)

单细胞转录组数据挖掘流程记录-BRCA乳腺癌(E-MTAB-8107)

单细胞转录组数据挖掘流程记录-BRCA乳腺癌(GSE161529)

单细胞转录组数据挖掘流程记录-CRC直肠癌(GSE178341)

单细胞转录组-monocle3分析结果解读

转录组时序数据分析课程上架

《肠型分析》课程上架

遗传图构建与QTL定位课程上新

graphics包的barplot()函数绘制柱状堆叠图

QTL定位介绍

蛋白互作网络工具Cytoscape的安装与使用

《T2T基因组组装和注释》课程上新

招聘 | 山东农业大学杨龙课题组招聘博士后

创建自己的docker镜像

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉