tidyplots学习超详细注释版-基于Cursor-(2)
教程地址:https://jbengler.github.io/tidyplots/articles/tidyplots.html
本入门指南旨在授权没有编程背景的个人使用tidyplots进行基于代码的绘图。我们将从涵盖基本软件工具和讨论数据准备开始。接下来,我们将介绍tidyplots工作流程,包括添加、重新移动和调整绘图组件。最后,我们将展示主题和多图布局的应用
数据准备
在开始绘图之前,第一件事是确保您的数据是整洁的。更正式地说,在整洁的数据中
每个变量必须有自己的列 每个观察必须有自己的行 每个值必须有自己的单元格
tidyplots附带了许多可用于绘图的整洁演示数据集。我们首先加载tidyplots包并查看研究数据集。
library(tidyplots)
study
如您所见,研究数据集由一个包含7列(也称为变量)和20行(也称为观察)的表格组成。研究参与者接受了4种不同的治疗(A、B、C或D),并测量了一个分数来评估治疗的成功
绘图
现在是有趣部分的时候了!确保您加载了tidyplots包。这需要为每个R会话执行一次。
library(tidyplots)
然后我们从研究数据集开始,并将其通过管道传输到tidyploc()函数中。
study %>%
tidyplot(x = treatment, y = score)
这就是你的第一个整洁绘图!诚然,它看起来仍然有点空。我们马上就会处理这个问题。但首先让我们仔细看看上面的代码。
在第一行中,我们从研究数据集开始。%>%称为管道,并确保将第一行的输出作为输入传递到下一行。在第二行中,我们生成tidyplot,并使用tidyplot()函数的x和y参数指定要用于x和y轴的变量。
添加-add
接下来,让我们在绘图中添加更多元素。这是通过使用一系列以add_开头的函数来完成的。例如,我们可以通过在代码中再添加一行来添加数据点。请注意,我们需要在每一行的末尾有一个%>%,输出应该通过管道传输到下一行。当您像这样组合多行时,您已经生成了一个管道。
study %>%
tidyplot(x = treatment, y = score) %>%
add_data_points()
当然,您不必就此止步。您可以选择许多add_*()函数。tidyplots包中所有功能的概述可以在包索引中找到。
https://jbengler.github.io/tidyplots/reference/index.html
现在,让我们在绘图中添加一些条形图。一旦你开始在RStudio中输入“add”,你应该会在你的课程旁边看到一个小窗口,显示所有以“添加”开头的可用函数,因此可以用来构建你的绘图。您还可以通过点击制表符键手动触发自动完成窗口。
在tidyplots中,以add_开头的函数名通常与要绘制的统计实体一起继续,例如平均值、中位数、计数等。作为下一块,您决定使用哪种图形表示,例如条形图、虚线、实线等。在我们的示例中,我们选择add_mean_bar()来显示以条形图表示的每个实验组的平均值。
study %>%
tidyplot(x = treatment, y = score) %>%
add_data_points() %>%
add_mean_bar(alpha = 0.4)
这里需要注意的一点是,我添加了alpha=0.4作为add_mean_bar()函数的参数。这为条形图增加了一点透明度,并导致与数据点相比颜色较浅的蓝色。 有些人可能不太喜欢条形图。所以让我们把条形图换成线。当我们在做的时候,让我们加上平均sem的标准误差,表示为误差条。
# 使用管道操作符 %>% 将study数据集传递给后续函数
study %>%
# 创建基础散点图
# x轴为treatment(处理)变量
# y轴为score(得分)变量
tidyplot(x = treatment, y = score) %>%
# 添加原始数据点
# 将每个样本的实际观测值以点的形式展示
add_data_points() %>%
# 添加均值虚线
# 用虚线标记各组的平均表达水平
add_mean_dash() %>%
# 添加标准误误差棒
# 在均值处添加误差棒表示标准误范围
add_sem_errorbar()
我想现在你已经明白原则了。你可以继续添加图层,直到你的图片有你需要的所有元素。
但是我们还需要介绍一个构建块,那就是颜色。颜色是在绘图中编码信息的一种非常强大的方式。由于颜色可以以与轴类似的方式编码变量,因此需要在tidyplot()函数的初始调用中提供参数颜色。
study %>%
tidyplot(x = group, y = score, color = dose) %>%
add_data_points() %>%
add_mean_dash() %>%
add_sem_errorbar()
如您所见,颜色作为一种按第三个变量对数据进行分组的方式,从而补充了x轴和y轴。
虽然还有更多add_*()函数可用,但我将在这里停下来,给您留下包索引和关于可视化数据的文章以获得进一步的灵感。
https://jbengler.github.io/tidyplots/articles/Visualizing-data.html