2019-2024年上半年单细胞多组学在植物研究中的发文情况

文摘   2024-06-27 11:29   江苏  

🔗scRNA-seq🔗scRNA-seq高级分析🔗scATAC-seq🔗R包开发🔗源码拆解🔗测试🔗RNA-seq🔗其它生信分析🔗R语言🔗Python🔗环境配置🔗文献分享🔗一只羊的碎碎念

一边写课程论文一边摸鱼,整理了2019年至今(2024上半年)单细胞技术在植物方向已发表的文章,除去毕业论文及中文、综述、工具/pipeline、protocol后,只统计研究性论文,约莫还剩130多篇(可能会有遗漏,见谅)。追踪文献这件事本来去年想干的,新建了一个小群,想几个人按照发表时间、研究团队、测序平台、分析工具等一一整理好,但毕竟属于没啥回报的事所以只好作罢。目前只整理了小部分,所以表格就不发了,仅记录一下整理的过程吧。

zotero中导出所有已发表文章

使用zotero用所有条目创建参考文献一键导出,粘贴到Excel中。

整理结果

此时所有信息都在第一列中,排序、删除序号后使用分列功能可以提取出每条文献的作者、标题、发表年份、期刊等信息,简单整理一下,大部分内容都是正确的。期刊匹配影响因子比较简单,VLOOKUP搞定。

然后就比较麻烦了,需要一篇一篇的打开记录本次统计最关注的东西,包括研究的物种、材料,以及组学信息。好在平时添加文章的时候很多也打了标签。

R语言绘制折线图

从总表中选择部分列用来绘图,以下格式:

作图就比较简单了,table统计,长格式转宽格式,修改因子水平,删掉发文量为0的行,ggpubr作图。

library(ggpubr)
library(reshape2)
library(ggprism)
library(ggsci)
data = read.csv("~/Desktop/单细胞发文统计.csv",header=T)
names(data)
#按组学进行统计
data=table(data$年,data$组学)
#改为长格式
data        = melt(data)
names(data) = c("年","组学","发文数")
unique(data$组学)
data$组学=factor(data$组学,levels=c("Sc/snRNA-seq","Stereo-seq","Sc/snATAC-seq","SnCUT&Tag","SciATAC-seq","ScWGBS-seq","Single-cell proteomics","Single-cell metabolomics","ScHi-C"))
data=subset(data,发文数>0)
#绘制散点折线图
ggline(data,
    x           = "年",
    y           = "发文数",
    group       = "组学",
    color       = "组学",
    ylab        = "Articles",
    xlab        = "Year",
)+
theme_prism()+
theme(
    text = element_text(family = "Times New Roman", color = "black"),
    legend.position = "right",
    aspect.ratio    = 1,
    axis.text.x     = element_text(size = 12, color = "black", angle = 45, hjust = 0.5, vjust = 0.5),
    axis.text.y     = element_text(size = 12, color = "black"),
    axis.title.x    = element_text(size = 14, color = "black"),
    axis.title.y    = element_text(size = 14, color = "black"),
    plot.title      = element_text(size = 16, color = "black"),
    legend.title    = element_text(size = 12, color = "black"),
    legend.text     = element_text(size = 12, color = "black"),
    legend.background = element_rect(fill = "white", color = "black", size = 0.5))+
scale_color_lancet()+
guides(color = guide_legend(title = "Omics"
title.theme = element_text(size = 12, color = "black")),
)

END


#

付费视频

#

推荐阅读

生信分析环境搭建

上游分析|植物gtf文件修改后进行上游分析

标准分析|标准分析全流程
标准分析|Read10X源码拆解
标准分析|自动获得QC阈值
标准分析|污染处理工具SoupX

注释|植物细胞marker的数据库
注释|自动注释小工具——SCSA

细胞分化|轨迹分析的基本概念1
细胞分化|轨迹分析的基本概念2
细胞分化|monocle1原理
细胞分化|解决monocle2报错
细胞分化|Cytotrace分析
细胞分化|使用VECTOR进行无监督发育方向推断
细胞分化|单细胞可变剪切分析全流程(基于velocyto.R)
细胞分化|不同scVelo模型
细胞分化|使用GeneTrajectory进行基因轨迹分析

富集分析|基于TBtools&R语言进行富集分析及可视化
富集分析|更新clusterprofiler包
富集分析|基因ID格式转换
富集分析|水稻富集分析
富集分析|植物组织特异性干细胞通路获取

可视化|Featureplot函数进阶
可视化|DotPlot函数进阶
可视化|给你的Dotplot添加聚类及其它统计信息

单细胞联合bulk|一文搞定R包Scissor

公共数据|EgdeTurbo下载CNCB数据
公共数据|不使用Read10x如何读取数据

#

关于我

分享内容:分子标记开发及种质资源鉴定、单细胞多组学数据分析、生信编程、算法原理、文献分享与复现等...

点个赞再走!


你好我是一只羊
个人号,内容主要涉及种质资源、分子标记开发及遗传多样性分析,表观遗传、编程语言在生物信息学中的应用、转录组、基因组、单细胞测序多组学数据分析等;其它更新平台:B站&小红书-一只羊做生信/捡羊毛的咩/生信小羊🐑
 最新文章