单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源
福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、单物种转录组、单菌基因组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。
目前可以通报的信息:
单物种转录组线上/线下开课时间:
2024/12/27-29, 2025/03/21-23
临床基因组线上/线下开课时间:
2025/2/21-23
单菌基因组线上/线下开课时间:
2025/1/10-12
宏基因组线上/线下开课时间:
2025年5月9-11
扩增子线上/线下开课时间:
2025/4/11-13
报名链接:http://www.ehbio.com/Training/
开课背景
微生物 (细菌、病毒和真菌)的全基因组测序 (Whole genome sequencing, WGS)技术已取得了长足的进步,可通过足够低的成本、可观的通量和较短的时间完成。国内外相关的公共数据库也日益充盈,积累了大量的基因组数据和完备的样本信息。此外,随着宏基因组测序越来越普遍,很多研究也不满足于只获取图谱,而是希望对目标菌进行深入分析。有了基因组数据及公共数据,如何根据特定的研究目的,运用生物信息学对数据进行整合、分析和解读,成为亟待解决的问题。
课程涵盖内容和适用范围
本课程利用全基因组测序(WGS)数据及生信方法,旨在研究:属于单个微生物物种 (Intra-specific)的特征菌株或病原体毒株基因组
。
具体是:围绕细菌、病毒或真菌基因组的第二/三代测序数据 (单个或多个分离株,每株分别测序或重测序),完成基因组组装、基因注释、遗传表征、分子分型、系统进化和传播溯源。
课程的测试数据来自细菌,但其分析框架也大体适用于病毒、真菌和原生生物。以上物种,具有一般的微生物学特征:个体小、增殖快、易传播;常为单倍体,基因组小;世代周期短,进化/演化迅速。以上特征,使其数据分析具有相似的理论依据和研究目标,例如有条件在单个课程内完成:从头组装 + 重测序分析;构建三类进化树 (普通系统发育树、时间树和传播树)。
对于其它物种,如大型动/植物基因组 (尤其是跨物种),则不适用此课程,原因包括:实施难度 (动/植物基因组的组装难度更大),分析模块 (动/植物无需做传播与溯源分析)及中间数据 (本课程主要利用核心基因组构树,而非同源基因)等。
课程中,原理与实操并重,包括:基本概念、研究案例、采样原则、数据分析、图表输出和结果解读。
适用的人群:微生物学、进化生物学、传染病/流行病学、临床微生物检验、公共卫生领域 (疾控中心)的相关学生或研究人员。
本课程的技术与理论体系,也有助于微生物实验室/课题组:建立系统的基因组分析流程,完善质量管理体系,培养相关生信人才,提示软件、流程及数据库的开发方向和评估方法。
课程资源和模式
理论与实操。本课程提供了计算平台 (Linux教学服务器)、课件 (PPT/PDF)、流程代码、生信软件 (仅用于学习;若使用,请引用原作者)、配套数据库、课程直播、视频回看和答疑群。这些软/硬件条件,可帮助学员:快速部署流程,熟悉操作方法,强化编程技能,完善理论学习,提升专业技能。
直播与回放。在直播课程上,会带领学员一步步完成数据分析,并穿插讲解课件。在线视频回看不限次数,涵盖全部直播过程。理论配合实操,理解技术要领,利于回顾、审查和优化分析流程。
流程和代码。本课程提供搭建好的单菌基因组分析流程,主要基于Linux系统、R语言和部分Python脚本,以应对繁重、批量化的计算任务,同时保持整体分析的灵活性和可重复计算。代码,记录了分析的过程和细节,存档在计算机中,便于使用、回顾、审查、优化、发表和共享。一些在线数据分析与可视化工具,能够简化相对固定的分析模块,可配合使用。
分析流程和课程主线
课程大纲和时间安排
每节课1小时一个主题,理论结合实战,学懂原理,实战操作,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课。(实际上课时顺序会略有调整)
01、02和03是课前的准备工作 (提前观看软件安装视频,或参加提前进行的软件安装直播)。
编号 | 主题 | 简介 |
---|---|---|
01 | 系统与软件 | Bioconda, Git, R, Rstudio, R包,PC软件安装等, Ubuntu子系统 |
02 | 编程基础 | Linux系列教程, Linux常用命令, 生信程序基础课节选 |
03 | Linux软件安装 | Conda安装与配置, 相关软件安装 |
11 | 组装 | 基本概念, 测序质量评估 (NGS/TGS) |
12 | 组装 | 全基因组从头 (De novo)组装 |
13 | 组装 | Nanopore/PacBio组装的NGS纠错 |
14 | 注释 | 基因组草图过滤、排序及评估, 物种鉴定 |
15 | 注释 | 多位点序列分型 (MLST), 表型预测 (耐药/毒力) |
16 | 注释 | 功能基因注释, 泛基因组分析、构树及绘图 |
21 | 核心基因组 | 序列变异, 基因型, SNP序列比对/对齐 |
22 | 核心基因组 | 计算遗传距离, 去除高频重组区 |
23 | 系统发育树 | 基于SNP构树, 最大似然法 (FastTree/RaxML/IQ-TREE) |
24 | 系统发育树 | 进化树分簇, 可视化制图 |
25 | 时间树 | 贝叶斯法 (BEAST), 时间刻度树 |
26 | 溯祖 | 推断祖先日期, 贝叶斯天际线图 |
31 | R统计与绘图 | R包Ape进化分析, 邻接树, 最小进化树 |
32 | R统计与绘图 | 遗传距离统计与绘图, 树的注释与关联 |
33 | 溯源 | 传播 (树)与溯源分析 |
34 | 文献案例 | 典型文献及其图形解读 |
课程关键词: 细菌、病毒、真菌全基因组测序;基因组组装与注释;分子遗传与进化;核心基因组;基因组流行病学/暴发流行;传播溯源。
欢迎参加、学习!