01
数据分析普及计划(第一批)
为了提高科研工作者对数据的处理能力,通过分析复杂数据,辅助研究者发现隐藏的生物学特征,从而将其转变为可以被认知的研究数据,为研究人员提供了全新维度的科研发现的可能性,加速了科学发现的进程。为此,我们举办了生命科学数据分析技能普及计划。
技能普及目标
2.系统学习多组学分析包括机器学习(临床预后模型)、转录组(RNAseq)、单细胞测序、表观遗传(Chipseq、ATACseq)、时空测序,一次学到位
3.将CNS文章数据分析内容全部学懂(理解)、学会(会敲代码分析)、学透彻(课题顶层设计和思路挖掘)、学以致用(用到标书申请和文章发表中)
►►►
技能普及计划质量保证
1.从19年开始到现在,我们在生信教育领域深耕五年之久,时间是最好的证明!
►►►
数据分析技能普及计划特色
3.授课方式采用线上线下相结合,同步进行。线上腾讯会议直播课,互动答疑。线下在南京,现场教学更踏实!
►►►
普及内容
第一节:编程基础学习--R语言
1.R和Rstudio的安装、环境配置
2.R语言简单语法及常见命令
3.以Cell文章方法描述学习R包的安装及使用
第二节:编程基础知识---数据结构
1.向量、矩阵、数据框和列表的创建和索引
2.多种数据结构的合并【Cell】
3.自定义Function函数构建
第三节:以Nature文章源代码学习转录组数据表达矩阵处理基本处理
1.重复基因和缺失值的删除
2.不同分组样本的批量归类【Nature】
3.多个样本的表达矩阵合并
第四节:以Cell文章源代码学习生存曲线
1.临床预后信息的批量整理
2.创建生存对象、拟合曲线【Cell】
3.特定基因的筛选构建预后分组
第五节:差异分析 RNAseq数据分析
1.芯片数据上游分析【Cancer Discovery】
2.多个样本的数据归一化处理
3.分组矩阵系统讲解【Nature】
4.Deseq2分析流程【Science】
第六节:以多篇CNS文章源代码学习画图
1.ggplot体系画图包括热图
2.火山图 箱线图 小提琴图【Nature】
3.多分组显著性p值添加方法【Nat Med】
4.三维pca图展示差异特征【Science】
第七节:基因集富集分析
1.over representation
2.GSEA 富集 【Cancer Cell】
3.包括自定义基因集的富集分析
4.富集通路网络图【Nat Genet】
第八节:以Nature文章为例系统讲解单细胞转录组基本分析
1.单细胞在CNS文章思路解析及常见图形解读
2.数据质控、数据放缩、PCA降维、聚类
3.三维tSNE、UMAP可视化【Science】
第九节 :单细胞转录组拟时序分析
1.monocle拟时序分析 【Nature】
2.细胞排序,构造一棵生成树
3.基因随轨迹分析变化热图【Cell】
4.BEAM轨迹分支分析【Nature】
5.自测和挖掘单细胞项目思路归纳总结
第十节:空间转录组理论及分析内容
1.空间转录组技术发展历程和原理介绍
2.空间转录组CNS文章思路解析及常见图解读
3.10x Visium 基本分析流程【Cancer Cell】
第十一节课:高分辨空间转录组分析
1.Xenium 空转数据分析【Nature】
2.Visium HD空转数据分析【Cell】
3.Stereo-seq “亚细胞级分辨率”测序介绍
4.空间测序多截面3D邻域重建【Nature】
第十二节课:机器学习基础理论
1.随机森林和支持向量机(SVM)
2.弹性网络回归算法Enet【Cell】
第十三节课:表观遗传研究
1.ChIP-seq、ATAC-seq在CNS文章中应用
2.ChIP-seq数据分析峰值可视化【Nature】
3.ATAC-seq数据peak注释【Cancer Cell】
第十四节:加权基因共表达网络分析 (WGCNA)算法系统讲解以nature文章为例
1.构建邻接矩阵和拓扑重叠矩阵
2.无尺度网络模型【Nature】
第十五节:免疫浸润计算
1.CIBERSORT反卷积算法,以TCGA数据为例
2.非监督共识聚类算法【Science】
3.转录因子富集【Cell Stem Cell】
第十六节:大数据分析在基金申请中应用
第十七节:实践课(课程总结,带领学员使用自测数据完成整体分析流程)
主讲老师介绍
周六下午2:30--5:30、周日上午9:00--12:00、
周日晚上7:00--9:00
线上:腾讯会议线上直播
每人:¥3880元(可开会务费 、培训费、数据分析费、测试费、测序技术服务费等发票)