1万小时定律是个非常热门的概念。但是,1万小时并非一个放之四海而皆准的整理,它有很多的限定条件。“刻意练习”下的1万小时才有用!那如何通过刻意练习成为杰出人物呢?一、产生兴趣;二、专注认真Focus;三、获得反馈Feedback;四、修正创新Fix。作为技能性学习,敲代码、理解代码和使用代码是从生信菜鸟转变成生信大佬的必由之路!
在纯生信21天中,我们就已经分享,对于生信研究,大趋势是生信筛选+生信验证+湿实验。公共数据库目前可用,R语言处理GEO和TCGA数据则成为趋势。湿实验逐渐成为必须,因为更可靠。目前,单细胞、多组学的干湿结合研究,或许是目前发表生信论文最快的方式!
########--------R包安装--------########
## 榴莲说:在开这个R语言专栏前,其实反反复复纠结一件事情,到底是从《R语言实战》还是《R数据科学》开始分享。毋庸置疑,这两本书在R语言方面都是挺有代表性的。《R语言实战》更倾向于R语言零基础入门学习,更偏基础理论学习和统计建模。
## 《R数据科学》更倾向于入门的数据科学应用,会丢给你一个小例子,然后引你深入学习,非常有意思(英文资料网址:https://r4ds.had.co.nz/)。事实上,作为生信学习R语言更倾向于应用,所以尝试以《R数据科学》为主,《R语言实战》为辅的方式,开启R语言专栏。欢迎大家一起探讨学习。
## R包,简单直白的理解,就是别人写好的工具包,你可以不需要知道这个工具是怎么开发的、甚至不清楚这个工具全部的功能,但你知道在什么时候用什么工具,使用工具的正确方式以及清楚工具的结果解释就可以。R包通常包括:R 函数、实例数据、预编译代码的集合,包括 R 程序,注释文档、实例、测试数据等。
# 01_CRAN:官方存储库,它是一个由全球 R 社区维护的 ftp 和 Web 服务器网络
http="https://mirrors.tuna.tsinghua.edu.cn/CRAN"
install.packages("ggplot2", repo=site) # 单个包安装
install.packages(c("ggplot2", "ggforce","ggsci")) # 多个包安装
# 02_Bioconductor:这是一个专题库,用于生物信息学的开源软件
install.packages('BiocManager') # 安装BiocManager
library(BiocManager) # import 已经安装的BiocManager
BiocManager::install(c("GSEABase","GSVA","clusterProfiler" ),ask = F,update = F) # 利用BiocManager安装其他的包
# 03_Github:不是R语言特有的。只有这个平台,没有与之相关的审核机制
install.packages('devtools') # 安装devtools包
library(devtools) # import devtools包
devtools::install_github("calligross/ggthemeassist") # 从github安装
# 04_手动安装,从网站下载相关压缩包,然后本地读取
download.file("https://cran.r-project.org/src/contrib/Archive/amap/amap_0.6.tar.gz","amap_0.6.tar.gz") # 下载R包
install.packages("amap_0.6.tar.gz",repos=NULL) # 安装R包
对于处理了很多项目,储存很多代码的电脑来说,R 或 RStudio的更新可能带来原有代码无法运行,数据无法复现的问题。因此,在实施项目前,可以先把 R 和 RStudio都更新到最新版;在实施项目后,尽量不要更新,直到项目完成!个人观点,供参考!代码如下:
http="https://mirrors.tuna.tsinghua.edu.cn/CRAN" #设置镜像
install.packages("installr") #R的安装
library(installr)
updateR() #R的更新
#打开RStudio, 点击“help”下面的“Check for Updates”即可更新 RStudio
installr::updateR(fast = T,copy_packages = T) #更新R,不更新包
参考资料:https://www.r-project.org/
.libPaths() #默认文件夹位置
getwd() #获取数据位置
setwd() #更改数据位置
b、使用setwd()转变当前工作文件的路径。但R for Data Science并不推荐这种方式!
####----R_Learning_Preparations----####
rm(list = ls()) #删除路径下的所有对象
gc() #在储存空间中完全删除所有对象,并报告内存使用情况
getwd() #获得工作路径
stringsAsFactors = FALSE #当数据框含有字符时,字符不要转化为因子
追溯历史,2006年统计之都网站的成立似乎可以算做 R 语言在中国的元年,尽管两年后才有了第一届中国 R 语言会议。统计之都(Capital of Statistics,简称 COS)成立于2006年5月,旨在推广与应用统计学知识,创建成中国的统计学门户网站。统计之都网站最初由谢益辉(现为RStudio软件工程师)创办,现由世界各地志愿者共同管理和维护。
统计之都的成员在 R 相关书籍翻译上做出了大量的工作!翻译《R语言实战》的高涛、肖楠和陈钢,翻译《R语言编程艺术》的陈堰平、邱怡轩、潘岚锋和熊喜,整理《153分钟学习R》的刘思喆,“Y叔”余光创等都是统计之都的成员(https://cosx.org/members/)。感谢!!
在之后几年里,R 语言的推广似乎并没有多大进展。直到2013年11月,生信菜鸟团创建!创始人曾健明(Jimmy),开始把 R 语言培训推广开来。2016年8月,生信技能树创建,是中国第一家专注于生信知识体系完善、促进生信学习交流的论坛。2018年,他们建立了专业的线下培训体系;2019年开始在全国各主要城市培训。后来由于疫情,培训形式主要是线上。他们在 R 语言的推广上做出了巨大贡献!说实话,尽管 R 语言培训如雨后春笋,但是最知名的,可能还是生信技能树以及专门分享单细胞内容的单细胞天地!
因为疫情,2020年前后涌现了一大批生信相关的公众号。芒果师兄聊生信就是在2020年初诞生的,芒果团队则是在与果友不断互动中形成的。与其他团队不同,芒果师兄聊生信侧重于生信技能在科研中的实际应用,致力于搭建临床和科研沟通桥梁,并结合临床知识和科学前沿,与医生朋友一起学习,共同成长!