“生信零代码”时代来临:Cell的分析照样零基础做

文摘   2025-01-02 21:30   安徽  


作为科研者,如果你到现在还不知道生物信息学,那真的太out了,生信有多火?拿最有名的数据库TCGA(Cancer Genome Atlas)来说,目前已经收录了来自1万多例病人的33种癌症的数据,2.5PB的数据量。


在pubmed中随便搜一个TCGA,就可以发现近年来相关文献发表量在成指数级增长。



这其中,一部分是利用TCGA数据库发表的纯生信文章,比如2018年4月发表在Cell上的一篇Comprehensive Characterization of Cancer Driver Genes and Mutations”。



也有很多利用TCGA数据库的图片给文章增色的,比如2019年3月4,耶鲁大学陈列平教授团队在Nature Medicine上发表题为Siglec-15 as an immune suppressor and potential target for normalization cancer immunotherapy 的文章,里面就利用TCGA数据库分析了Siglec-15 和T cell signature genes (CD3E, IFNG, GZMA and GZMB) 在膀胱癌中的关系。



而这些都不需要额外的湿实验,大大提高了临床医生的科研效率。这也是生信之所以火的原因了。


但你可能要问,如果不会R语言,不会代码,怎么利用利用生信来提高科研效率呢?


或许参加过好几千一次的培训班,但结果就是,课堂上什么都会,一回去自己弄马上就被各种报错打败,自学视频,同样是困难重重。



科研界一直需要一个功能强大,不需要代码,可视化分析工具。


国内知名科研工具箱平台——科研者之家(Home for Researchers)上有一个生信零代码版块:


已经有数十种分析模块,整合了TCGA,GEO,Target,ICGC,CCLE五大公共数据库的样本数据,可以直接拿来用。

平台是由几个临床医生联合生信大拿一起搭建,界面极其简介。


比如在TCGA模块,左侧栏就是TCGA上所有33种肿瘤类型,之后第二期会纳入非肿瘤的疾病。顶部是各种分析模块。首页特别注明了,所有数据均由R v4.0.3分析完成, 意思就是说在平台上分析的结果和拿R语言敲代码分析的结果是完全一样的,这就太爽了。



别看界面简单,该平台功能极其强大,比如想分析下“某个基因在肺腺癌里EGFR突变和野生型病人中表达水平和预后差异”就轻而易举。


平台有极其强大的样本筛选功能,可以对样本进行除了临床信息,治疗信息的进一步筛选外,比如可以根据某一个基因是否突变筛选,某一个基因的表达量水平进行筛选,比如近年来火热的肺腺癌EGFR野生型伴PDL-1低表达相关研究,就完全没问题了。这也是目前已知所有第三方网站无法实现的。


样本筛选表


样本筛选好后,就可以选择需要的功能模块进一步分析啦。


单样本分析,顾名思义就是针对某一个样本的分析,里面的工具目前包括了临床信息比较,批量生存分析,基因与生存,基因与TMB/MSI,桑基图,两基因相关性。



而多样本分析,就是针对某几个样本之间差异的比较,目前包括以下工具:

多组生存,基因表达比较,miRNA比较,突变比较,免疫评分,免疫检查点,甚至铁死亡,m6A



在复杂分析里,集成了以下耳熟能详的分析模块,比如亚组分型,基因突变景观,差异基因分析,预后模型(列线图),预后模型(Signature)泛癌分析。



然后,在思维导图和视频教程里,180师兄和911师兄讲解了如何使用“十字研究法”,交叉运用单样本和多样本工具,让课题设计思如泉涌。



这些分析如果让公司去做,估计要几百上千甚至上万了,而这个平台鼠标点击几下,就可以生成所有的高清矢量图,更重要的是还有对应的原始数据下载,这个相当重要。


不仅如此,平台还针对每一个分析结果,给出了对应图例,方法学,结果的中英文对照,和参考文献,这个对我们写文章也很重要。



从课题设计,工具使用,再到零代码,一键分析,原始数据下载,再到论文写作,不得不说,这个由一群医生创建的生信平台,实在是太懂广大科研gou了。


有木有一种相见恨晚的赶脚呢?


临床生信之家-www.aclbi.com,它为“生信分析0代码”而生,赶紧收藏吧!


弗雷赛斯

-浙江大学硕博创建于2015年

查重 | 润色 | 绘图 在线课程 | 课题合作 SCI写作神器 期刊查询神器


让天下没有难做的科研--联系我们:freescience@zju.edu.cn



以上内容包广告

Journal Daily
客观评价,科学选刊。
 最新文章