RNA-seq|样本相关性散点图

文摘 2024-05-23 15:43 江苏

🔗单细胞测序、🔗单细胞转录组高级分析、 🔗R包开发、🔗源码拆解、 🔗测试、🔗RNA-seq 、 🔗R语言、🔗Python 、🔗环境配置、🔗文献分享、🔗其它生信分析、 🔗一只羊的碎碎念

样品间的相关性反应了样品间的相似程度，即不同处理或组织的样品在表达水平方面的相似度。重复实验可以帮助减少实验误差并提高结果的可靠性和稳定性，以此确保不是个体的偶然变异对结果产生影响。

技术重复（Technical Replicates）：技术重复是在同一样本上进行多次测序的实验。通过技术重复可以评估测序实验的重复性和准确性，帮助排除实验误差和随机噪声对结果的影响。
生物学重复（Biological Replicates）：生物学重复是使用不同的生物样本进行多次测序的实验。通过生物学重复可以评估实验结果的稳健性和一致性，帮助识别真实的生物学变化并排除个体差异对结果的影响。

以转录组数据为例，一般会设置3-5个生物学重复，如何确认生物学重复的效果好坏呢，方法有很多，可以进行相关性分析，绘制热图，可以PCA分析，也可以绘制聚类热图，以上方法在《R语言科研作图实例》均有介绍。今天带来的是一个简单的使用ggpubr绘制RNA-seq样本相关性散点图的实际案例。

读取表达矩阵，这里展示的数据1-3列为样本1的重复，4-6列为样本2的重复。在这里选择100行作为结果展示。

library(ggplot2)
library(ggpubr)
library(dplyr)
#读取数据
exp <- read.csv("~/分析代码/R/散点图/20240523 样本相关性分析/data.csv",row.names=1)
head(exp)

#计算基因均值
exp$sample1 = rowMeans(exp[,1:3])
exp$sample2    = rowMeans(exp[,4:6])
#取log
exp$log_sample1=log2(exp$sample1)
exp$log_sample2=log2(exp$sample2)
head(exp)

data=exp[,9:10]

data <- data %>% sample_n(100)#实际使用去掉这里
nrow(data)

绘制散点图并保存。相关系数的计算方法有三种：A. Pearson correlation; B. Spearman rank correlation; C. Kendall’s τ。使用ggpubr可以轻松绘制一个好看的散点图，再配合ggplot进行美化工作。

p = ggscatter(data, 
  x  = "log_sample1",
  y  = "log_sample2",
cor.coef         = TRUE,
cor.method       = "pearson",
cor.coef.size    = 3,
cor.coeff.args   = list( method  = "pearson",label.sep   = "\n"),
size = 1)+
  theme_bw()+
  theme(
    axis.title        = element_text(size = 12,face='bold'),
    axis.text         = element_text(size = 9),
    axis.ticks.length = unit(0.3, 'cm'),
    panel.grid        = element_blank(),
    aspect.ratio      = 1, 
    panel.border      = element_rect(linewidth = 1,fill = NA),
    plot.margin       = margin(1,1,1,1,'cm'),)+
      labs(x=expression(log[2] ~"sample1"),
       y=expression(log[2] ~"sample2"))+
geom_vline(xintercept = 0, linetype = "dashed", color = "black")+
geom_hline(yintercept = 0, linetype = "dashed", color = "black")

#保存结果
svg("~/分析代码/R/散点图/20240523 样本相关性分析/test.svg",width = 6)
print(p)
dev.off()

可以总结的是：

在对表达矩阵可视化/计算时经常会取log2
在ggpubr绘制散点图时，cor.coeff.args可以对相关系数进行设置
expression的用法：下标为[]，上标为^，空格为~，连接符为*。

END

付费合集

最新文章

【代码】Ro/e分析量化单细胞亚群分布偏好

文献分享 | 烟草幼苗期单细胞转录组图谱 | 植物单细胞互作分析

【代码】美化 | 单细胞转录组多组差异基因火山图/环形火山图

【视频+代码】CellPhoneDB v5 | CellPhoneDB v5 可视化之网络图和贝壳图

文献分享 | 拟南芥叶片感染假单胞菌的单细胞图谱

【视频+代码】CellPhoneDB v5 | CellPhoneDB v5 可视化之热图改进

【视频+代码】CellPhoneDB v5 | 下载安装、代码实操及结果解读

单细胞转录组高级分析 | CellPhoneDB v5简介

环境配置 | homer安装

环境配置 | MACS2简介

【视频+代码】使用Liger进行综合非负矩阵分解(iNMF) | 不同批次/平台/物种/模态整合方案

【视频】跟着Cell Metabolism学作图 | 使用Plot1Cell包绘制单细胞降维图

【单篇付费】细胞分化分析|monocle1原理

【单篇付费】高级分析之细胞分化 | monocle2原理

【单篇付费】高级分析之细胞分化 | monocle2安装及实战

年中回顾 | 一只羊的2023年总结&2024规划

提供10G+练习数据，零基础做ER，柳叶刀，Nature的技术方案：影像组学人工智能实操培训班＋数据委托实验

Linux | shell脚本封装模板（内含资源分享）

高通量测序 | 高通量测序的发展历程（内含资源分享）

分子标记 | popgene32使用限制

文献分享 | 武汉大学王坤教授和周宇教授团队利用单细胞技术发现棉纤维细胞昼夜节律性生长的调控机制

文献复现4 | 人类肝细胞图谱2

文献复现3 | 人类肝细胞图谱1-数据下载

scATAC | 桑基图可视化liger整合结果（包含NA值的处理）

【单篇付费】细胞分化分析|轨迹分析的基本概念

【单篇付费】细胞分化分析|轨迹分析的基本概念2

【单篇付费】Cellranger单细胞转录组上游分析流程回顾|非人/小鼠特殊物种gtf文件修改添加线粒体、叶绿体标记

高级分析之细胞分化 | monocle2安装及实战

单细胞实战-拟南芥根(3)-使用monocle2构建细胞分化轨迹

scATAC | 使用Liger v2整合单细胞转录组和染色质开放数据

生信不要总是局限在预后模型

scATAC|如何描述基因表达与染色质开放的相关性

哇塞！你敢信？生信领域要“变天”了新技术问世，将打破困扰科研界长久以来的难题！

2019-2024年上半年单细胞多组学在植物研究中的发文情况

文献分享 | 浙江大学樊龙江团队绘制首张水稻种胚单细胞时空图谱

小技巧|使用GenomicFeatures包轻松获得基因长度

表观遗传|ChIP-seq、CUT&Tag和CUT&RUN

高级分析之细胞分化 | monocle2原理

文献分享 | 拟南芥茎尖的单细胞转录组分析

scATAC | 使用Cell Ranger ATAC进行上游分析（适用于非人/小鼠）

Nature重磅 | 颠覆认知：华人学者首次揭示“表观遗传”由细胞质中“无名小卒”精细调控！

文献分享 | 整合单细胞分析揭示肾透明细胞癌的转录和表观遗传调控特征

文献分享|水稻根尖单细胞转录组及染色质可及性图谱

多端同步|Typora+GitHub+jsDelivr+Picgo搭建图床

生信指北|开源第一步，GitHub白嫖学生包认证流程

表观多组学|DNA甲基化相关基础知识

RNA-seq|样本相关性散点图

测试|cytotrace v1使用不同细胞数对结果的影响

代码笔记容易忘？推荐这款Markdown写作神器Typora（附MAC版下载）

文献分享-2023-scPlant：植物单细胞转录组数据分析的框架

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉