tidyplots学习超详细注释版-基于Cursor-(2)

文摘   2024-11-28 00:00   北京  

tidyplots学习超详细注释版-基于Cursor-(2)

教程首页

教程地址:https://jbengler.github.io/tidyplots/articles/tidyplots.html

本入门指南旨在授权没有编程背景的个人使用tidyplots进行基于代码的绘图。我们将从涵盖基本软件工具和讨论数据准备开始。接下来,我们将介绍tidyplots工作流程,包括添加、重新移动和调整绘图组件。最后,我们将展示主题和多图布局的应用

数据准备

在开始绘图之前,第一件事是确保您的数据是整洁的。更正式地说,在整洁的数据中

  1. 每个变量必须有自己的列
  2. 每个观察必须有自己的行
  3. 每个值必须有自己的单元格

tidyplots附带了许多可用于绘图的整洁演示数据集。我们首先加载tidyplots包并查看研究数据集。

library(tidyplots)
study

如您所见,研究数据集由一个包含7列(也称为变量)和20行(也称为观察)的表格组成。研究参与者接受了4种不同的治疗(A、B、C或D),并测量了一个分数来评估治疗的成功

绘图

现在是有趣部分的时候了!确保您加载了tidyplots包。这需要为每个R会话执行一次。

library(tidyplots)

然后我们从研究数据集开始,并将其通过管道传输到tidyploc()函数中。

study %>% 
  tidyplot(x = treatment, y = score)

这就是你的第一个整洁绘图!诚然,它看起来仍然有点空。我们马上就会处理这个问题。但首先让我们仔细看看上面的代码。

在第一行中,我们从研究数据集开始。%>%称为管道,并确保将第一行的输出作为输入传递到下一行。在第二行中,我们生成tidyplot,并使用tidyplot()函数的x和y参数指定要用于x和y轴的变量。

添加-add

接下来,让我们在绘图中添加更多元素。这是通过使用一系列以add_开头的函数来完成的。例如,我们可以通过在代码中再添加一行来添加数据点。请注意,我们需要在每一行的末尾有一个%>%,输出应该通过管道传输到下一行。当您像这样组合多行时,您已经生成了一个管道。

study %>% 
  tidyplot(x = treatment, y = score) %>% 
  add_data_points()

当然,您不必就此止步。您可以选择许多add_*()函数。tidyplots包中所有功能的概述可以在包索引中找到。

https://jbengler.github.io/tidyplots/reference/index.html

现在,让我们在绘图中添加一些条形图。一旦你开始在RStudio中输入“add”,你应该会在你的课程旁边看到一个小窗口,显示所有以“添加”开头的可用函数,因此可以用来构建你的绘图。您还可以通过点击制表符键手动触发自动完成窗口。

cursor可以自动补全

在tidyplots中,以add_开头的函数名通常与要绘制的统计实体一起继续,例如平均值、中位数、计数等。作为下一块,您决定使用哪种图形表示,例如条形图、虚线、实线等。在我们的示例中,我们选择add_mean_bar()来显示以条形图表示的每个实验组的平均值。

study %>% 
  tidyplot(x = treatment, y = score) %>% 
  add_data_points() %>% 
  add_mean_bar(alpha = 0.4)

这里需要注意的一点是,我添加了alpha=0.4作为add_mean_bar()函数的参数。这为条形图增加了一点透明度,并导致与数据点相比颜色较浅的蓝色。 有些人可能不太喜欢条形图。所以让我们把条形图换成线。当我们在做的时候,让我们加上平均sem的标准误差,表示为误差条。

# 使用管道操作符 %>% 将study数据集传递给后续函数
study %>% 
  # 创建基础散点图
  # x轴为treatment(处理)变量
  # y轴为score(得分)变量
  tidyplot(x = treatment, y = score) %>% 
  # 添加原始数据点
  # 将每个样本的实际观测值以点的形式展示
  add_data_points() %>% 
  # 添加均值虚线
  # 用虚线标记各组的平均表达水平
  add_mean_dash() %>% 
  # 添加标准误误差棒
  # 在均值处添加误差棒表示标准误范围
  add_sem_errorbar()

我想现在你已经明白原则了。你可以继续添加图层,直到你的图片有你需要的所有元素。

但是我们还需要介绍一个构建块,那就是颜色。颜色是在绘图中编码信息的一种非常强大的方式。由于颜色可以以与轴类似的方式编码变量,因此需要在tidyplot()函数的初始调用中提供参数颜色。

study %>% 
  tidyplot(x = group, y = score, color = dose) %>% 
  add_data_points() %>% 
  add_mean_dash() %>% 
  add_sem_errorbar()

如您所见,颜色作为一种按第三个变量对数据进行分组的方式,从而补充了x轴和y轴。

虽然还有更多add_*()函数可用,但我将在这里停下来,给您留下包索引和关于可视化数据的文章以获得进一步的灵感。

https://jbengler.github.io/tidyplots/articles/Visualizing-data.html


如果您对真实世界研究/临床因果估计方法/生信分析/影像组学人工智能算法感兴趣可以通过下方的微信加我的交流群

助教微信-程老师
助教微信-金老师

欢迎关注我的视频号-定期直播免费文献分享会

扫一扫,添加我的视频号

欢迎关注我的知乎同名账号-更加专业和系统的知识分享

我的知乎

欢迎关注我的B站账号-公开课及文献分享视频会更新至此

我的B站


灵活胖子的科研进步之路
医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。
 最新文章