在模仿中精进数据可视化_使用ggtree绘制配对连线的进化树

文摘   2024-11-28 21:31   中国香港  

在模仿中精进数据可视化_使用ggtree绘制配对连线的进化树

在模仿中精进数据可视化该系列推文中,我们将从各大顶级学术期刊Figure入手,
解读文章的绘图思路,
模仿文章的作图风格,
构建适宜的绘图数据,
并且将代码应用到自己的实际论文中。

旧推文,再发一个,因为这个旧推文蕴含的思想,直接为我后续文章的图片做一个深厚的铺垫。

仔细思考思考这里面的细节,非常有意思。


绘图缘由:小伙伴们总会展示出一些非常好看且精美的图片。我大概率会去学习和复现一下。其实每个人的时间和精力都非常有限和异常宝贵的。之所以我会去,主要有以下原因:

  1. 图片非常好看,我自己看着也手痒痒
  2. 图片我自己在Paper也用的上,储备着留着用
  3. 保持了持续学习的状态

文献图片如下:

其实这是一个配对的进化树,Y叔ggtree里面其实有了非常好的demo了。
具体请查看https://yulab-smu.top/treedata-book/chapter2.html
直接去查看ggtree的官网文档,查看代码即可。

最近画了太多太多的进化树了,群里的小伙伴们也会开开玩笑,哈哈哈哈哈哈哈。

不过,Y叔的确是掌管进化树的!yyds!

我在Y叔的代码的基础之上进行了一些些的微调,实现的图片如下:

我写的也是个demo,至于线条的颜色,粗细,透明度,完全是可以调整的,自己手动diy就可以啦。


代码如下

加载R包

rm(list = ls())

####----load R Package----####
library(tidyverse)
library(ggtree)
library(ggbump)
library(patchwork)

加载数据

####----load Data----####
set.seed(1115)

x <- rtree(30)

y <- rtree(30)

开始绘图

####----在此基础上魔改----####
p1 <- ggtree(x, layout = "roundrect", branch.length = "none") + 
  geom_tiplab(align = T, offset = 0.5, linesize = NA) +
  geom_hilight(
    mapping = aes(subset = node %in% c(38, 48, 58, 36),
                  node = node,
                  fill = as.character(node))
  ) + 
  labs(fill = "Left") + 
  geom_tippoint(aes(x = x + 0.1), shape = 21, size = 3, fill = "#7fcdbb")

p1


p2 <- ggtree(y, layout = "ellipse", branch.length = "none") + 
  geom_tiplab(align = T, offset = 0.1, linesize = NA) +
  geom_tippoint(aes(x = x + 0.1), shape = 23, size = 3, fill = "#fa9fb5")

p2

接下来是数据处理的部分,这一部分让我觉得Y叔实在是牛B!

# reverse x-axis and set offset to make the tree on the right-hand side of the first tree
d1 <- p1$data
d2 <- p2$data

d2$x <- max(d2$x) - d2$x + max(d1$x) + 15

pp <- p1 + 
  geom_tree(data = d2, layout = "ellipse", branch.length = "none") +
  geom_tiplab(data = d2, aes(x = x - 2),  align = T, offset = 0.1, linesize = NA) +
  ggnewscale::new_scale_fill() + 
  geom_hilight(
    data = d2,
    mapping = aes(
      subset = node %in% c(38, 48, 58),
      node = node,
      fill = as.factor(node)
    )
  ) +
  labs(fill = "Right") + 
  geom_tippoint(data = d2, aes(x = x - 0.5), shape = 23, size = 3, fill = "#fa9fb5")

pp

# 准备连线的数据
dd <- bind_rows(d1 %>% dplyr::mutate(x = x +2) , 
                d2 %>% dplyr::mutate(x = x -3)) %>%
  dplyr::filter(!is.na(label))

绘制一个直线的配对进化树

p1 <- pp + 
  geom_line(aes(x, y, group = label), data = dd, color = "grey")

ggsave(filename = "p1.pdf",
       plot = p1,
       height = 8, 
       width = 8)    

绘制一个曲线的配对进化树


p2 <- pp + 
  geom_bump(aes(x, y, group = label), data = dd, color = "grey", linewidth = 1) 

ggsave(filename = "p2.pdf",
       plot = p2,
       height = 8, 
       width = 8)

拼图和保存

####----combine----####
p_combine <- p1 + p2

ggsave(filename = "p_combine.pdf",
       plot = p_combine,
       height = 8, 
       width = 18)

版本信息

####----sessionInfo----####
sessionInfo()

R version 4.3.0 (2023-04-21)
Platform: x86_64-apple-darwin20 (64-bit)
Running under: macOS 14.5

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/lib/libRlapack.dylib;  LAPACK version 3.11.0

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

time zone: Asia/Shanghai
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] patchwork_1.2.0.9000 ggbump_0.1.0         ggtree_3.10.0        lubridate_1.9.3     
 [5] forcats_1.0.0        stringr_1.5.1        dplyr_1.1.4          purrr_1.0.2         
 [9] readr_2.1.5          tidyr_1.3.1          tibble_3.2.1         ggplot2_3.4.4       
[13] tidyverse_2.0.0     

loaded via a namespace (and not attached):
 [1] yulab.utils_0.1.0      utf8_1.2.4             generics_0.1.3         ggplotify_0.1.2       
 [5] stringi_1.8.3          lattice_0.22-5         shadowtext_0.1.2       hms_1.1.3             
 [9] digest_0.6.35          magrittr_2.0.3         grid_4.3.0             timechange_0.2.0      
[13] fastmap_1.1.1          Matrix_1.6-5           jsonlite_1.8.7         ggnewscale_0.4.10.9000
[17] ape_5.8                mgcv_1.9-0             fansi_1.0.6            aplot_0.2.2           
[21] scales_1.3.0           textshaping_0.3.7      lazyeval_0.2.2         cli_3.6.2             
[25] rlang_1.1.3            splines_4.3.0          munsell_0.5.0          tidytree_0.4.5        
[29] withr_3.0.0            cachem_1.0.8           tools_4.3.0            parallel_4.3.0        
[33] tzdb_0.4.0             memoise_2.0.1          colorspace_2.1-0       vctrs_0.6.5           
[37] R6_2.5.1               gridGraphics_0.5-1     lifecycle_1.0.4        fs_1.6.3              
[41] ggfun_0.1.3            ragg_1.2.6             treeio_1.26.0          pkgconfig_2.0.3       
[45] pillar_1.9.0           gtable_0.3.4           glue_1.7.0             Rcpp_1.0.11           
[49] systemfonts_1.0.5      tidyselect_1.2.1       rstudioapi_0.15.0      farver_2.1.1          
[53] nlme_3.1-163           labeling_0.4.3         compiler_4.3.0     

历史绘图合集


进化树合集


环状图


散点图


基因家族合集

换一个排布方式:

首先查看基础版热图:

然后再看进阶版热图:


基因组共线性


WGCNA ggplot2版本


其他科研绘图


合作、联系和交流

有很多小伙伴在后台私信作者,非常抱歉,我经常看不到导致错过,请添加下面的微信联系作者,一起交流数据分析和可视化。


RPython
人生苦短,R和Python。
 最新文章