将植物的基因表达量、激素水平、信号反应或其它定量数据,映射到对应或具有代表性的组织器官图谱上,以形象生物的卡通热图进行呈现,可以让科研人员有机会识别数据中的模式并提出假设,从而提高数据可视化的可解释性和洞察力。
目前越来越多文献也会用到该类可视化方式,更直观呈现对应组织器官的定量或分类数据,如下:
Fig1(bioRxiv,2024)[1]
Fig2(bioRxiv,2024)[1]
Fig3(Mol Plant,2021)[2]
看着是不是很令人心动?那么如何绘制或获取该类组织器官热图,运用于自己的研究呢?目前最常用的有ggPlantmap(R包)以及ePlant(在线网站工具)两种,本期分享给大家。
1
ggPlantmap
开源R包ggPlantmap,可通过真实植物照片创建ggplot图表,展示植物组织部位、不同生长发育阶段、细胞剖面结构等,同时也能将基因定量数据映射到植物图谱上,分析基因的表达特征或空间定量模式。
#相关R包安装与载入:
library(devtools)
install_github("leonardojo/ggPlantmap")
library(ggPlantmap)
library(ggplot2)
library(cols4all)
library(cowplot)
绘制不同组织器官图谱
# ggPm.summary探索:
head(ggPm.summary) #内置数据集,R包中自带预加载对象的名称/物种/组织等描述信息
#查看预加载对象格式,可通过第一列名称直接调用:
ggPm.At.lateralroot.devseries #拟南芥侧根发育图谱
#生成拟南芥根尖横切面图谱(ggPlantmap.plot函数)
ggPlantmap.plot(data = ggPm.At.roottip.crosssection)
#生成拟南芥根尖纵切面图谱
ggPlantmap.plot(data = ggPm.At.roottip.longitudinal)
#也可通过ggplot2调用(geom_polygon函数):
#查看数据格式:
head(ggPm.At.roottip.crosssection)
#自定义配色与ggplot2绘图:
c4a_gui()
mycol <- c4a('10', 8)
p <- ggplot(data = ggPm.At.roottip.crosssection, aes(x = x, y = y)) +
geom_polygon(aes(group = ROI.id, fill = ROI.name), color = 'black') +
coord_fixed() +
scale_fill_manual(values = alpha(mycol, 0.7)) +
theme_void()
p
其它组织部位的数据加载方法相同,这里不再赘述。
植物图谱叠加基因定量数据
如果想要将定量数据映射到植物图谱上,ROI级别名称要和定量数据表格的ROI名称完全匹配,再将两个数据merge。
#以LEC1在拟南芥种子发育过程的表达水平为例:
exp <- ggPm.At.seed.expression.sample ##LEC1表达量数据集
map <- ggPm.At.seed.devseries #植物图谱数据集
head(exp)
head(map)
table(exp$ROI.name %in% map$ROI.name) #ROI.name需要完全匹配
#数据融合:
merge <- ggPlantmap.merge(map, exp, 'ROI.name')
head(merge)
#生成热图:
ggPlantmap.heatmap(merge, AT5G47670.expression)
#自定义配色与主题:
P1 <- ggPlantmap.heatmap(merge, AT5G47670.expression) +
scale_fill_continuous_c4a_seq('rd_pu',reverse = F) +
ggtitle('The expression of LEC1 during the development of Arabidopsis seed') +
mytheme
p1
当然,该R包还可将自己的实验植物照片生成绘图数据,需下载一个叫Icy的开源成像软件 (https://icy.bioimageanalysis.org/),按官方教程生成即可。更多内容可见作者说明、发表刊物[3]或往期推文《如何绘制special植物热图?》
2
ePlant
可视化在线工具eplant,在单一门户中提供集成的搜索、分析和可视化功能。其特色之一在于,探究目标基因在物种不同组织器官的表达模式或实验结果时,采用了植物热图呈现其对应部位的表达水平:
进入首页,可点击Gene Expression and Protein Tools可快速跳转下方基因表达和蛋白质工具部分。
网站链接:https://bar.utoronto.ca/
除了第一个eplant(拟南芥),还可以看到很多其它常用研究物种,如玉米、杨树、番茄、亚麻荠、大豆、马铃薯、大麦、小麦、苜蓿、桉树、水稻、柳树、向日葵、大麻、甘蔗等等,点击感兴趣物种可进入对应探索页面。
以拟南芥为例,点击eplant进入。在页面左侧可输入目标基因(支持多个),在模块查看器中可切换不同探索分析点,如查看基因信息、出版物信息、植物表达水平热图、亚细胞定位染色体位置、蛋白互作、蛋白质3D结构、基因组可视化、外部链接等等。
以ABI3为例,在植物eFP查看(Plant eFP viewers)模块,可查看当前选中基因在物种不同组织器官的表达水平,表达量直接以热图的形式映射在植物对应位置。
点击右上角和查看使用数据的引文和实验信息,也可下载到原始数据。
在组织和实验eFP查看(Tissue & Experiment eFP viewers)模块,提供有关单个组织中基因表达的详细信息,以及不同实验处理下的结果。
另外,点击上方的Set eFP colors可自定义植物热图配色,图表都可输出位PNG或SVG格式。
其它物种如玉米(部分):
马铃薯(部分):
更多功能模块的使用,可戳往期《使用植物热图直观show出目标基因表达模式!》,或结合网站说明、发表刊物[4]使用。
好啦,今日分享毕!更多科研干货、绘图技能关注SCIPainter不迷路!
READ MORE
延伸阅读
参考文献
【1】Transcription factors SlMYB41, SlMYB92 and SlWRKY71 regulate gene expression in the tomato exodermis[预印本]
*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。