在模仿中精进数据可视化_基因在染色体定位图

文摘   2024-10-04 23:10   中国香港  

在模仿中精进数据可视化_基因在染色体定位图


在模仿中精进数据可视化该系列推文中,我们将从各大顶级学术期刊Figure入手,
解读文章的绘图思路,
模仿文章的作图风格,
构建适宜的绘图数据,
并且将代码应用到自己的实际论文中。


绘图缘由:小伙伴们总会展示出一些非常好看且精美的图片。我大概率会去学习和复现一下。其实每个人的时间和精力都非常有限和异常宝贵的。之所以我会去,主要有以下原因:

  1. 图片非常好看,我自己看着也手痒痒
  2. 图片我自己在Paper也用的上,储备着留着用
  3. 保持了持续学习的状态

论文来源:

论文图片:

图片复现:

版本1

版本2

版本3

以上结果都依赖于一款RRIdeogram只要配置好数据格式,就可以轻松愉快的绘制基因在染色体上的分布图。


直接上代码:

加载R

rm(list = ls())
####----load R Package----####
library(RIdeogram)
library(tidyverse)

加载数据

####----load Data----####
karyotype <- read_delim(file = "karyotype.txt", delim = "\t", col_names = T)
density <- read_delim(file = "density.txt", delim = "\t", col_names = T)
data <- read_delim(file = "data.txt", delim = "\t", col_names = T)

可视化

版本1

####----Plot----####

# version 1
ideogram(karyotype = karyotype,
         label = data, 
         label_type = "marker",
         output = "chromosome.svg")

svg2pdf("chromosome.svg", file = "chromosome")

版本2

# version2
ideogram(karyotype = karyotype, 
         overlaid = density, 
         label = data, 
         label_type = "marker",
         output = "chromosome2.svg"
         )
svg2pdf("chromosome2.svg", file = "chromosome2")

版本3

# version3
ideogram(karyotype = karyotype, 
         overlaid = density, 
         label = data, 
         label_type = "marker",
         colorset1 = c("#5ab4ac""#ffffbf""#f1a340"),
         output = "chromosome3.svg"
)
svg2pdf("chromosome3.svg", file = "chromosome3")

可以深入学习一下RIdeogram包中函数的用法。

版本信息

####----sessionInfo----####
sessionInfo()

R version 4.3.0 (2023-04-21)
Platform: x86_64-apple-darwin20 (64-bit)
Running under: macOS 14.6.1

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/lib/libRlapack.dylib;  LAPACK version 3.11.0

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

time zone: Asia/Shanghai
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] lubridate_1.9.3 forcats_1.0.0   stringr_1.5.1   dplyr_1.1.4     purrr_1.0.2     readr_2.1.5     tidyr_1.3.1     tibble_3.2.1   
 [9] ggplot2_3.5.1   tidyverse_2.0.0 RIdeogram_0.2.2

loaded via a namespace (and not attached):
 [1] bit_4.0.5         gtable_0.3.5      crayon_1.5.2      compiler_4.3.0    tidyselect_1.2.1  rsvg_2.6.0        parallel_4.3.0   
 [8] textshaping_0.3.7 systemfonts_1.1.0 scales_1.3.0      png_0.1-8         R6_2.5.1          generics_0.1.3    grImport2_0.3-3  
[15] XML_3.99-0.15     munsell_0.5.1     pillar_1.9.0      tzdb_0.4.0        rlang_1.1.4       utf8_1.2.4        stringi_1.8.3    
[22] bit64_4.0.5       timechange_0.2.0  cli_3.6.3         withr_3.0.1       magrittr_2.0.3    grid_4.3.0        vroom_1.6.4      
[29] rstudioapi_0.15.0 base64enc_0.1-3   hms_1.1.3         lifecycle_1.0.4   vctrs_0.6.5       glue_1.7.0        ragg_1.2.6       
[36] fansi_1.0.6       colorspace_2.1-1  jpeg_0.1-10       tools_4.3.0       pkgconfig_2.0.3       

历史绘图合集


进化树合集


环状图


散点图


基因家族合集

换一个排布方式:

首先查看基础版热图:

然后再看进阶版热图:


基因组共线性


WGCNA ggplot2版本


其他科研绘图


合作、联系和交流

有很多小伙伴在后台私信作者,非常抱歉,我经常看不到导致错过,请添加下面的微信联系作者,一起交流数据分析和可视化。


RPython
人生苦短,R和Python。
 最新文章