大清早刷了一下自己的gmail邮箱,发现了“Ming Tang”(大佬)的来信:
深有同感啊!我也是这样磕磕碰碰一路跌跌撞撞走过来了的,因为自己淋过雨所以想给大家撑伞。这里借花献佛给大家一个分享每天学生信超过10小时的“Ming Tang”(大佬)整理的转录组流程:https://github.com/crazyhottommy/RNA-seq-analysis
这个项目作者是“Ming Tang”(大佬),大佬的介绍是:I have over 12 years of computational biology experience, 6 years of molecular cancer biology and 4 years of immunology experience.
大佬在Embracing the command line: my unexpected career in computational biology
中介绍,每天工作至少10小时。
内容框架
General sequencing data analysis materials RNA-seq specific RNA-seq experimental design Quality Control
具体的细节我让人工智能大模型简单的翻译和汇总了一下:
以下是对合辑内容的汇总,涵盖了转录组数据分析的各个方面:
1. 通用测序数据分析材料
**Next-Gen Sequence Analysis Workshop (2015)**:由Titus Brown(现于UC Davis)举办。 BMMB 852: Applied Bioinformatics:由Istvan Albert从宾州州立大学开发,他是biostars的开发者。 Steven Turner:在UVA维护基因组数据分析培训机会列表。 Jeff Leek团队:推荐基因组学论文。 NGS文件格式教程:优秀的NGS文件格式教程。 UVA Bioconnector Workshops:UVA生物连接器工作坊。 错误QC失败解释:解释错误QC失败的原因。 EMBL-EBI在线培训课程:提供全面的在线培训课程列表。
2. RNA-seq特定资源
RNA测序:青少年时期:一篇不错的综述。 RNA测序数据:表达分析的指南:指南和教程。 RNA-seq分析介绍视频:YouTube视频。 RNA-seq差异表达分析:NGS2015的教程。 Kallisto和sleuth教程:Lior Patcher实验室提供的快速RNA-seq分析。 GAGE路径分析:使用GAGE进行路径分析的教程。 Sailfish、DESeq2、GAGE和Pathview的差异表达与路径分析:综合教程。 Illumina高通量RNA测序数据分析的正常化方法评估:评估不同正常化方法。 RNA-seq教程维基:提供RNA-seq分析的网络资源。 RNA-seqlopedia:从样本准备到数据分析的RNA-seq介绍。 RNA-seq数据从数据木匠分析:数据木匠提供的RNA-seq数据分析。 Isoform预过滤提高基于计数方法的性能:提高性能的研究论文。 RNA-seq数据分析最佳实践调查:调查最佳实践的研究论文。 高通量mRNA和小RNA测序的可重复性:研究论文。 跨平台微阵列和RNA-seq数据的标准化:研究论文。
3. RNA-seq实验设计
RNA Seq实验设计思考:基础博客文章。 RNA Seq实验设计教程:biostars提供的教程。 Scotty:RNA Seq实验的功率分析工具。 差异丰度分析的实验设计:网络服务器。 差异丰度分析的实验设计:bioconductor包。
4. 质量控制
QoRTs:RNA-Seq实验的质量控制和数据处理工具集。 QUaCRS:RNA-seq数据的质量控制。 RSeQC:RNA-seq数据QC。 RNA-SeqQC:RNA-seq数据QC。
5. 标准化、定量和差异表达
DESeq2标准化:Simon Anders提供的标准化方法。 大小因子估计:DESeq包的estimateSizeFactors函数。 不同样本RNA-Seq标准化方法比较:比较不同方法。 RNA-Seq定量错误影响人类疾病相关基因:研究论文。 不同Illumina高通量RNA测序数据分析的正常化方法比较:比较不同方法。
6. 传统RNA-seq分析方法
RNA-seq分析的自然协议:自然协议。 基于计数的差异表达分析:使用R和Bioconductor的分析。 TopHat和Cufflinks的RNA-seq实验差异基因和转录本表达分析。
7. 单细胞RNA-seq分析
单细胞RNA-seq分析教程:剑桥大学提供的教程。 单细胞RNA-seq数据分析的步骤:f1000提供的教程。 单细胞RNA-seq数据的低水平分析:Aaron Lun提供的教程。 单细胞RNA-seq数据的分析和可视化:bioconductor提供的教程。
8. 基因集富集分析
基因集分析方法:RNA-seq数据的基因集分析方法。 Metascape:基因集分析网络服务器。 GSEA:Broad Institute提供的基因集富集分析。 singscore:单样本基因集评分方法。
9. 融合基因检测
融合基因检测准确性评估:评估不同方法的准确性。 MINTIE:识别转录本中的新型结构和剪接变体。 Arriba:快速准确的基因融合检测工具。 Fusioncatcher:基因融合检测工具。
10. 剪接异构体分析
SplicePlot:剪接异构体可视化工具。 MATS:多变量分析转录本剪接。 SNPlice:分析SNP和剪接的共发生。
11. 单细胞RNA-seq数据集
JingleBells:标准化的单细胞RNA-Seq数据集资源库。
这个合辑提供了从基础的测序数据分析到特定领域的高级分析方法的全面资源,适合不同层次和需求的研究者。
而且现在有了人工智能大模型大家阅读外文材料或者陌生的知识点,都可以极大的加速。不过,如果是确实是希望看原汁原味的中文方向,我们《生信菜鸟团》的转录组专辑也值得推荐哈!耗时两年, 每周更新一次,接近100个实战笔记分享:
如何去掉数据中的离群样本? 转录组测序的count矩阵如何去批次呢(sva包的ComBat_seq函数) 转录上游有必要进行质控分析吗? 利用单细胞数据对bulk进行反卷积 使用kBET检测批次效应 读研生活寡淡如水,所以在R里整点花活儿 如何判断PCA哪些主成分是有意义 寻找网络中的hub节点 单细胞DEGs、markers、celltypes | 专辑完结篇 一些辅助划分单细胞亚型的工具 使用snakemake管理转录组流程 融合基因鉴定以及GATK寻找突变 癌症样本全转录组数据的融合基因鉴定 差异表达分析没那么简单 鉴定lncRNA流程全套代码整理 初探mRNA、lncRNA联合分析之下游 初探mRNA、lncRNA联合分析之上游 上下调基因数量不平衡?再探! 谈谈那些R处理结果中非常小的p值 使用Clipper控制FDR应对高通量数据分析p值失真问题 这bug有《走近科学》那味儿了 (DESeq2) Why are some p values set to NA? 奇怪的转录组差异表达矩阵之实验分组 Harvard Chan Bioinformatics Core学习资源介绍 RASflow原理理解、项目部署及运行 在线/本地获取gmt文件进行GSEA分析 基因集分析的前世今生(附进行通路富集分析的9个tips) 明明PCA区分非常好,但是差异基因数量很少? 转录组差异分析中上下调基因数量不平衡现象 MetaSRA:SRA的标准化元数据! 使用TPM/FPKM/RPKM进行差异分析真的可以消除系统误差吗? 两个系统整理的转录组数据库:DEE2和recount3 你还在花800块钱进行普通bulk转录组定量吗 一文了解转录组组差异分析工具差异 复现1与复现2的真实画法 复现3-基因外显子的定量分析图—可变剪切 复现2---以热图复现谈巧妙配色与去除热图聚类树小技巧 转录组推文纠正--上游四套定量流程一网打尽 复现1---火山图的另一种画法 转录组----新的转折 一文教你在线分析circRNA表达矩阵 什么,转录组有些分组可能注定是无法分开的! 太神奇了,网页上简简单单的5步完成转录组差异分析!!! 转录组常规分析,这篇推文够吗? 转录组数据除了常规差异分析,你还可以这样做 批量读取转录组数据,绘制感兴趣的GSEA通路 如何进行批量差异分析并绘制其火山图及拼图 单样本间的差异分析 都是FPKM进行差异分析,为啥差异感觉这么大呢? 转录组差异分析FPKM与count处理差别大吗 PCA效果不行,我们可以试试这样补救下 十款差异分析R包在这三年有什么变化吗? PCA效果不行,该数据还能分析吗? 转录组上游定量其实真不难,4步可定(四)之终结篇 转录组上游定量其实真不难,4步可定(三) 转录组上游定量分析其实真不难,4步可定(二) 转录组上游定量分析其实真不难,4步可定(一) 转录组差异分析这样做能行吗? 三种转录组差异分析方法及区别你会了吗? 使用单细胞转录组学进行时间建模 单细胞转录组与转录组联合分析的痛点 如何做单样本之间的差异分析? P值窜天高背后的原因探究及探究如何正确利用好富集分析的结果---(重磅干货的感觉) P值竟窜天高,我的流程错了吗 转录组差异分析P值与FDR值区别有多大 转录组数据三分组的差异分析方式 转录组数据三分组的差异分析方式