在模仿中精进数据可视化_绘制配对箱形图

文摘   2024-10-03 23:15   中国香港  

在模仿中精进数据可视化_绘制配对箱形图


在模仿中精进数据可视化该系列推文中,我们将从各大顶级学术期刊Figure入手,
解读文章的绘图思路,
模仿文章的作图风格,
构建适宜的绘图数据,
并且将代码应用到自己的实际论文中。


绘图缘由:小伙伴们总会展示出一些非常好看且精美的图片。我大概率会去学习和复现一下。其实每个人的时间和精力都非常有限和异常宝贵的。之所以我会去,主要有以下原因:

  1. 图片非常好看,我自己看着也手痒痒
  2. 图片我自己在Paper也用的上,储备着留着用
  3. 保持了持续学习的状态

论文来源:

论文图片:

图片复现:


除此之外,我在论文里面还发现了昨天推文的实例:

昨天的推文图片:

链接如下:

在模仿中精进数据可视化_进阶版本的火山图

大家可以自行去学习一下。


直接上代码:

加载R

rm(list = ls())

####----load R Package----####
library(tidyverse)

加载数据

####----load Data----####
df <- read_xlsx(path = "df.xlsx")
  
df2 <- df %>%
  tidyr::pivot_longer(cols = -patient, names_to = "Type", values_to = "Value") %>%
  dplyr::mutate(Type = str_c(Type, "\n""(N = 32)")) %>%
  dplyr::mutate(Type = factor(Type, levels = c("mRNA\n(N = 32)""Gene\n(N = 32)"), ordered = T))

p_value <- wilcox.test(df$mRNA, df$Gene)
p_value2 <- p_value$p.value

可视化

####----Plot----####
p <- ggplot(data = df2, aes(x = Type, y = Value)) + 
  geom_boxplot(aes(fill = Type), width = 0.5, alpha = 0.4) + 
  geom_point(aes(color = Type)) + 
  geom_line(aes(group = patient), linetype = 2, color = "#fa9fb5") + 
  ggtitle(label = expression(italic("P") == "6.386861e-12")) + 
  theme_bw() + 
  theme( 
    axis.text = element_text(color = "#000000", size = 12.5),
    axis.title = element_text(color = "#000000", size = 15),
    axis.ticks.length = unit(10, "pt"),
    plot.title = element_text(hjust = 0.5, size = 20),
    legend.position = "none"
  )

ggsave(filename = "p.pdf",
       plot = p,
       height = 6,
       width = 7.5)

版本信息

####----sessionInfo----####
sessionInfo()

R version 4.3.0 (2023-04-21)
Platform: x86_64-apple-darwin20 (64-bit)
Running under: macOS 14.6.1

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/lib/libRlapack.dylib;  LAPACK version 3.11.0

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

time zone: Asia/Shanghai
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] writexl_1.4.2   readxl_1.4.3    lubridate_1.9.3 forcats_1.0.0   stringr_1.5.1   dplyr_1.1.4    
 [7] purrr_1.0.2     readr_2.1.5     tidyr_1.3.1     tibble_3.2.1    ggplot2_3.5.1   tidyverse_2.0.0

loaded via a namespace (and not attached):
 [1] gtable_0.3.5      compiler_4.3.0    tidyselect_1.2.1  textshaping_0.3.7 systemfonts_1.1.0
 [6] scales_1.3.0      R6_2.5.1          labeling_0.4.3    generics_0.1.3    munsell_0.5.1    
[11] pillar_1.9.0      tzdb_0.4.0        rlang_1.1.4       utf8_1.2.4        stringi_1.8.3    
[16] pkgload_1.3.3     viridisLite_0.4.2 timechange_0.2.0  cli_3.6.3         withr_3.0.1      
[21] magrittr_2.0.3    grid_4.3.0        rstudioapi_0.15.0 hms_1.1.3         lifecycle_1.0.4  
[26] vctrs_0.6.5       glue_1.7.0        farver_2.1.2      cellranger_1.1.0  ragg_1.2.6       
[31] fansi_1.0.6       colorspace_2.1-1  tools_4.3.0       pkgconfig_2.0.3       

历史绘图合集


进化树合集


环状图


散点图


基因家族合集

换一个排布方式:

首先查看基础版热图:

然后再看进阶版热图:


基因组共线性


WGCNA ggplot2版本


其他科研绘图


合作、联系和交流

有很多小伙伴在后台私信作者,非常抱歉,我经常看不到导致错过,请添加下面的微信联系作者,一起交流数据分析和可视化。


RPython
人生苦短,R和Python。
 最新文章