真正的分别,不是互道再见,而是同样洒满阳光的早晨,有人轻舟已过万重山,有人还停在昨天!拜别权威教材,才是真正成长!

学术   2024-10-24 00:06   上海  
历经几年辛苦,杨晨博士的又一篇文章快要见刊了。与之前论文大不同的是,这篇文章是干湿结合的研究,而非纯生信论文(没见到原文,根据题目推测的)。恭喜杨博!这几年彻底完成了从生信到干湿研究的蜕变和成长!必须点赞!

1万小时定律是个非常热门的概念。但是,1万小时并非一个放之四海而皆准的整理,它有很多的限定条件。“刻意练习”下的1万小时才有用!那如何通过刻意练习成为杰出人物呢?一、产生兴趣;二、专注认真Focus;三、获得反馈Feedback;四、修正创新Fix。作为技能性学习,敲代码、理解代码和使用代码是从生信菜鸟转变成生信大佬的必由之路!

在纯生信21天中,我们就已经分享,对于生信研究,大趋势是生信筛选+生信验证+湿实验。公共数据库目前可用,R语言处理GEO和TCGA数据则成为趋势。湿实验逐渐成为必须,因为更可靠。目前,单细胞、多组学的干湿结合研究,或许是目前发表生信论文最快的方式

https://pan.baidu.com/s/1I-hj-YNMej8mbln1izZfdA?pwd=1235,1235
每个人情况不同,有的小伙伴已能处理单细胞数据,有的小伙伴可能连纯生信都没弄懂。因此,现在学习 R ,既不是最早的时候,也不是最晚的时候,而很有可能是最好的时候根据我们的经验来看,在实际操作之前,最好先了解些 R 代码相关的基础知识。不管是 R 语言小白,还是老司机,以下两份资料都值得看一看。
如果是 R 语言小白,建议多看几遍;如果是老司机,可以用这些词条和问题,作为评估 R 知识储备的一次检测。这两份资料,第一份是刘思喆据Tom Short tshort@eprisolutions所撰写文档而翻译的《R 语言卡片》;第二份是刘思喆据 R 官方文档,以及来自互联网的 contributed documents;还有若干来自Capital Of Statistics 论坛的问题,整理汇编而成的《153分钟学R》。据说,刘思喆曾就职京东和教育平台51Talk,目前做智能型出行。
接下来,我们一起探讨几个简单的问题。
1. R 和 RStudio 经常更新!那么,一个基本问题:我们需要经常更新 R 和 RStudio吗
若是首次安装,安装现行版本即可关于 R 包安装,说来也看过不少推文,但让我印象最深刻的,仍然是榴莲的推文,高屋建瓴,框架清晰。那时,我们刚开始团队协作写推文,那是她按照多年经验整理而成的《R 数据科学》系列推文的第一篇。
########--------R包安装--------########## 榴莲说:在开这个R语言专栏前,其实反反复复纠结一件事情,到底是从《R语言实战》还是《R数据科学》开始分享。毋庸置疑,这两本书在R语言方面都是挺有代表性的。《R语言实战》更倾向于R语言零基础入门学习,更偏基础理论学习和统计建模。## 《R数据科学》更倾向于入门的数据科学应用,会丢给你一个小例子,然后引你深入学习,非常有意思(英文资料网址:https://r4ds.had.co.nz/)。事实上,作为生信学习R语言更倾向于应用,所以尝试以《R数据科学》为主,《R语言实战》为辅的方式,开启R语言专栏。欢迎大家一起探讨学习。## R包,简单直白的理解,就是别人写好的工具包,你可以不需要知道这个工具是怎么开发的、甚至不清楚这个工具全部的功能,但你知道在什么时候用什么工具,使用工具的正确方式以及清楚工具的结果解释就可以。R包通常包括:R 函数、实例数据、预编译代码的集合,包括 R 程序,注释文档、实例、测试数据等。
# 01_CRAN:官方存储库,它是一个由全球 R 社区维护的 ftp 和 Web 服务器网络http="https://mirrors.tuna.tsinghua.edu.cn/CRAN"install.packages("ggplot2", repo=site) # 单个包安装install.packages(c("ggplot2", "ggforce","ggsci")) # 多个包安装
# 02_Bioconductor:这是一个专题库,用于生物信息学的开源软件install.packages('BiocManager') # 安装BiocManagerlibrary(BiocManager) # import 已经安装的BiocManagerBiocManager::install(c("GSEABase","GSVA","clusterProfiler" ),ask = F,update = F) # 利用BiocManager安装其他的包
# 03_Github:不是R语言特有的。只有这个平台,没有与之相关的审核机制install.packages('devtools') # 安装devtools包library(devtools) # import devtools包devtools::install_github("calligross/ggthemeassist") # 从github安装
# 04_手动安装,从网站下载相关压缩包,然后本地读取download.file("https://cran.r-project.org/src/contrib/Archive/amap/amap_0.6.tar.gz","amap_0.6.tar.gz") # 下载R包install.packages("amap_0.6.tar.gz",repos=NULL) # 安装R包

对于处理了很多项目,储存很多代码的电脑来说,R 或 RStudio的更新可能带来原有代码无法运行,数据无法复现的问题。因此,在实施项目前,可以先把 R 和 RStudio都更新到最新版;在实施项目后,尽量不要更新,直到项目完成!个人观点,供参考!代码如下:

http="https://mirrors.tuna.tsinghua.edu.cn/CRAN" #设置镜像install.packages("installr") #R的安装library(installr) updateR() #R的更新#打开RStudio, 点击“help”下面的“Check for Updates”即可更新 RStudio
安装新版 R 后,可以使用以下代码保留原来的 R 包。
installr::updateR(fast = T,copy_packages = T) #更新R,不更新包

参考资料:https://www.r-project.org/

2. 在项目实施过程中,要不要设置路径?
在安装 R 时,无论是不是 C 盘,系统会产生一个默认位置,可通过.libPaths()查看。
.libPaths() #默认文件夹位置
在实际分析中,待分析数据有时与其默认文件夹位置不一致。通常有两种方法来处理:
getwd() #获取数据位置setwd() #更改数据位置
a、使用getwd()获取当前工作文件的路径,将待分析数据拷贝至默认文件夹;

b、使用setwd()转变当前工作文件的路径。但R for Data Science并不推荐这种方式!

3.在项目创建后,实际处理数据前,如何让电脑运算更快?我们需运行简单的四行代码。当然,这些代码是否必须,小伙伴们可能有不同看法。这里讨论的是处理不同数据集之间进行的操作。
####----R_Learning_Preparations----####rm(list = ls())             #删除路径下的所有对象gc()                        #在储存空间中完全删除所有对象,并报告内存使用情况getwd()                     #获得工作路径stringsAsFactors = FALSE    #当数据框含有字符时,字符不要转化为因子

追溯历史,2006年统计之都网站的成立似乎可以算做 R 语言在中国的元年,尽管两年后才有了第一届中国 R 语言会议。统计之都(Capital of Statistics,简称 COS)成立于2006年5月,旨在推广与应用统计学知识,创建成中国的统计学门户网站。统计之都网站最初由谢益辉(现为RStudio软件工程师)创办,现由世界各地志愿者共同管理和维护。

统计之都的成员在 R 相关书籍翻译上做出了大量的工作!翻译《R语言实战》的高涛、肖楠和陈钢,翻译《R语言编程艺术》的陈堰平、邱怡轩、潘岚锋和熊喜,整理《153分钟学习R》的刘思喆,“Y叔”余光创等都是统计之都的成员(https://cosx.org/members/)。感谢!!

在B站上,我们可以检索到统计之都的视频,但整体上观看数不多,多数只有几百观看。目前,统计之都网站每月出一次推荐文章,但是文章多偏向于算法、深度学习等,跟医药生物研究关联不是很大。或许这是他们观看数少的原因之一吧!

在之后几年里,R 语言的推广似乎并没有多大进展。直到2013年11月,生信菜鸟团创建!创始人曾健明(Jimmy),开始把 R 语言培训推广开来。2016年8月,生信技能树创建,是中国第一家专注于生信知识体系完善、促进生信学习交流的论坛。2018年,他们建立了专业的线下培训体系;2019年开始在全国各主要城市培训。后来由于疫情,培训形式主要是线上。他们在 R 语言的推广上做出了巨大贡献!说实话,尽管 R 语言培训如雨后春笋,但是最知名的,可能还是生信技能树以及专门分享单细胞内容的单细胞天地

因为疫情,2020年前后涌现了一大批生信相关的公众号。芒果师兄聊生信就是在2020年初诞生的,芒果团队则是在与果友不断互动中形成的。与其他团队不同,芒果师兄聊生信侧重于生信技能在科研中的实际应用,致力于搭建临床和科研沟通桥梁,并结合临床知识和科学前沿,与医生朋友一起学习,共同成长!

欢迎关注我们,开启 R 语言学习!
参考资料
统计之都,https://cosx.org/
生信菜鸟团,http://www.bio-info-trainee.com/1089.html
生信技能树,http://www.biotrainee.com/
因所知有限,不当之处,欢迎反馈;如有侵权,请联系删除。

芒果师兄聊生信
1.生信技能和基因编辑。2.论文发表和基金写作。3. 健康管理和医学科研资讯。4.幸福之路,读书,音乐和娱乐。
 最新文章