海归博导:我以为R包的安装不用教,直到遇到自己的学生

文摘   2025-01-09 09:00   荷兰  

还是那句话,当浮躁的大环境,让大家都无心钻研的情况下,伸手党已经是好学生了。还是要多多鼓励,所有的学生都会找到适合自己的节奏,自然就会进步的。

1. 前言

之前偶尔会收到私信的提问,一些特别简单的报错比如:“there is no package called ggplot2”. 可见困扰初学者的并不是复杂的模型推理,而是软件使用的细节。那么我们的教程也会更贴近基础知识,就从R包的安装开始吧。

R包是包含R函数、数据和编译代码的集合,它们被打包在一起用于解决特定的任务或问题,从数据处理到机器学习和可视化。理解和使用R包是R语言高效工作的关键之一。

R包的主要特点包括:

  • 提供可重用的函数。

  • 包含文档和示例。

  • 使社区开发的工具能够共享。

一些常用的R包包括:

  • ggplot2:高级数据可视化工具。

  • dplyr:数据处理。

  • caret:机器学习。

  • shiny:交互式网页应用。

2. R包存储库

R包通常托管在不同的存储库上,最著名的存储库包括:CRAN(Comprehensive R Archive Network):R包的主要来源,最值得信赖。Bioconductor:专注于生物信息学和计算生物学的包。GitHub:一个流行的托管平台,用于共享R包的开发版本。

对于大多数情况,CRAN是首选,因为它提供高质量且有文档支持的包。如果需要使用前沿或实验性的包,GitHub是一个不错的选择。

3. 从CRAN安装包

安装R包最直接的方式是使用install.packages()函数。

3.1 基本语法

install.packages("包名")

3.2 示例

安装ggplot2包:

install.packages("ggplot2")

3.3 一次安装多个包

你可以通过提供包名的向量一次性安装多个包:

install.packages(c("dplyr", "tidyr", "stringr"))

4 选择CRAN镜像

当系统提示时,选择一个离你地理位置较近的CRAN镜像以便更快下载。你也可以在repos参数中指定:

install.packages("ggplot2", repos = "https://cloud.r-project.org/")

4.1 从Bioconductor安装包

Bioconductor包需要安装BiocManager包。

安装BiocManager

install.packages("BiocManager")

使用BiocManager安装Bioconductor包:

BiocManager::install("GenomicFeatures")

5. 从GitHub安装包

GitHub托管着许多实验性和开发中的R包。可以使用devtools包来从GitHub安装包。

安装devtools包:

install.packages("devtools")

devtools::install_github("用户名/仓库名")

示例: 安装tidyverse开发版本:

devtools::install_github("tidyverse/ggplot2")

6. 从存档安装包

有时你可能需要安装某个包的旧版本,可能是由于兼容性问题或项目需求。这些旧版本可以从CRAN包存档中找到。

6.1 访问存档

CRAN维护着一个包存档,你可以在其中找到包的旧版本,存档的地址是:https://cran.r-project.org/src/contrib/Archive/

每个包的子目录中包含以.tar.gz格式保存的先前版本。

6.2 从存档安装包

步骤1:下载包的源文件。
访问包的存档页面,下载所需版本的
.tar.gz文件。

步骤2:从下载的文件安装包。

install.packages("路径/到/包.tar.gz", repos = NULL, type = "source")

6.2.2 示例

如果dplyr_1.0.5.tar.gz文件保存在你的下载文件夹中:

install.packages("~/Downloads/dplyr_1.0.5.tar.gz", repos = NULL, type = "source")

指定版本(另一种方法)

通过devtools包,你可以直接从CRAN存档安装特定版本的包:

devtools::install_version("dplyr", version = "1.0.5", repos = "http://cran.us.r-project.org")

7. 管理已安装的包

安装完包后,你可能需要更新或删除它们。

7.1 加载已安装的包

使用library()函数加载包到当前会话:

library(ggplot2)

7.2 检查已安装的包

列出所有已安装的包:

installed.packages()

7.3 更新包

更新所有包:

update.packages()

更新某个特定包:

install.packages("包名")

7.4 删除包

删除已安装的包:

remove.packages("包名")

小结

R包的安装是一个基础但很重要的技能,它使你能够充分利用R生态系统的强大功能。通过理解存储库、安装方法和解决安装问题的技巧,你可以优化工作流程,专注于分析和开发。希望后面有机会我们能一起探讨如何构建一个自己写的包。欢迎持续关注!

感谢关注,你的支持是我不懈的动力!

科研代码
专注R和Python的数据分析。
 最新文章