在模仿中精进数据可视化_使用R语言绘制聚类树进一步展示微生物的物种分类

文摘   2024-10-21 22:50   中国香港  

在模仿中精进数据可视化_使用R语言绘制聚类树进一步展示微生物的物种分类


写在前面的话:不知不觉之中在模仿中精进数据可视化已经有100个推文了,感觉各位朋友们,对我画图的推文还是蛮喜欢的。
由衷的感谢大家对我的认可。
可以这么说,在模仿中精进数据可视化的系列推文中,打的就是精锐,在阅读图片,模仿高水平论文可视化的过程中,实打实的提高自己的审美能力,磨练自己的可视化技能
100篇,即是一个记录,也是一个新的开始。 毕竟咱们的这个公众号也仅仅刚刚起步。


在模仿中精进数据可视化该系列推文中,我们将从各大顶级学术期刊Figure入手,
解读文章的绘图思路,
模仿文章的作图风格,
构建适宜的绘图数据,
并且将代码应用到自己的实际论文中。


绘图缘由:小伙伴们总会展示出一些非常好看且精美的图片。我大概率会去学习和复现一下。其实每个人的时间和精力都非常有限和异常宝贵的。之所以我会去,主要有以下原因:

  1. 图片非常好看,我自己看着也手痒痒
  2. 图片我自己在Paper也用的上,储备着留着用
  3. 保持了持续学习的状态

今天还是依旧感谢我的叶师兄,这家伙审美没得说,给我推荐的论文也都很炫。叶师兄推荐的这篇论文,简直是美图大赏。跟随着优秀的师兄师姐师弟师妹们,也能不断提高数据可视化能力。
期待着叶师兄的大作!

论文来源

论文图片

图片复现:

总而言之,还算不错。复现的较为全面。
画这个图,因为我自己的Paper会用到
画完之后依旧有一些瑕疵,比如在拼图的时候,Link的实现。
我在这里挖一个小坑,以后添上
因为我已经想好了解决问题的方案


唠叨几句ggraph果然是一个非常神的包。
我一直期待着想开发一个自己的网络的包,
奈何珠玉在前,我可能无法逾越,
不过换一个想法,我可能会在ggraph这个巨人的肩膀之上开发点儿我自己的小R包,
权当自娱自乐。不久就会与大家相见


直接上代码:

加载R

rm(list = ls())


####----load R Package----####
library(tidyverse)
library(readxl)
library(ggraph)
library(tidygraph)
source("R/Stat_taxonomy.R")
# 这里我自定义了一个函数,
#主要是用于批量处理ASV表和注释信息,
#并且构建下游画图的数据格式

加载数据

####----load Data----####
otu_plot <- stat_taxonomy_4_graph(file1 = "Input/16S_otutab.xlsx",
                                  file2 = "Input/16S_taxonomy.xlsx",
                                  topn = 3,
                                  number = 10)

graph_data <- tbl_graph(otu_plot[["node"]], otu_plot[["edge"]])

graph_data

可视化

####----Plot----####
p <- ggraph(graph_data, "tree") + 
  geom_hline(yintercept = 4) + 
  geom_edge_diagonal(color = "#bdbdbd", edge_width = 1) + 
  geom_node_point(aes(size = size), shape = 21, color = "#a6bddb", fill = "#ffffff", stroke = 3) + 
  geom_node_text(aes(x = x, label = node), 
                 angle = 90, vjust = 1.75,  fontface = "italic") + 
  theme_void() + 
  theme(
    plot.margin = margin(t = 1, r = 1, b = 1, l = 1, unit = "cm")
  ) 

p

ggsave(filename = "Output/p_tree.pdf",
       plot = p,
       height = 8,
       width = 20)

版本信息

####----sessionInfo----####
sessionInfo()

R version 4.3.0 (2023-04-21)
Platform: x86_64-apple-darwin20 (64-bit)
Running under: macOS 14.6.1

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/lib/libRlapack.dylib;  LAPACK version 3.11.0

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

time zone: Asia/Shanghai
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] ggraph_2.1.0    tidygraph_1.2.3 readxl_1.4.3    lubridate_1.9.3 forcats_1.0.0   stringr_1.5.1   dplyr_1.1.4    
 [8] purrr_1.0.2     readr_2.1.5     tidyr_1.3.1     tibble_3.2.1    ggplot2_3.5.1   tidyverse_2.0.0

loaded via a namespace (and not attached):
 [1] viridis_0.6.4      utf8_1.2.4         generics_0.1.3     stringi_1.8.3      hms_1.1.3          digest_0.6.36     
 [7] magrittr_2.0.3     grid_4.3.0         timechange_0.2.0   cellranger_1.1.0   ggrepel_0.9.6      gridExtra_2.3     
[13] fansi_1.0.6        viridisLite_0.4.2  scales_1.3.0       tweenr_2.0.3       textshaping_0.3.7  cli_3.6.3         
[19] rlang_1.1.4        graphlayouts_1.0.2 crayon_1.5.2       polyclip_1.10-7    munsell_0.5.1      withr_3.0.1       
[25] tools_4.3.0        tzdb_0.4.0         colorspace_2.1-1   vctrs_0.6.5        R6_2.5.1           lifecycle_1.0.4   
[31] MASS_7.3-60        ragg_1.2.6         pkgconfig_2.0.3    pillar_1.9.0       gtable_0.3.5       glue_1.7.0        
[37] Rcpp_1.0.13        systemfonts_1.1.0  ggforce_0.4.2      tidyselect_1.2.1   rstudioapi_0.15.0  farver_2.1.2      
[43] igraph_2.0.3       labeling_0.4.3     compiler_4.3.0    

历史绘图合集


进化树合集


环状图


散点图


基因家族合集

换一个排布方式:

首先查看基础版热图:

然后再看进阶版热图:


基因组共线性


WGCNA ggplot2版本


其他科研绘图


合作、联系和交流

有很多小伙伴在后台私信作者,非常抱歉,我经常看不到导致错过,请添加下面的微信联系作者,一起交流数据分析和可视化。


RPython
人生苦短,R和Python。
 最新文章