【微生物数据个性化分析及挖掘系列】基因组结构变异分析

学术   2024-11-27 14:36   上海  
高通量测序技术成本的降低和常规成熟技术的广泛普及,让数据高效且标准化的产出满足了研究者“获取数据”的基本需求,但同时,也使得标准的信息发掘基本不存在任何壁垒,直接的数据罗列展示和简单的描述性总结已无法发表科研论文,怎么才能让“沉睡的”测序数据“活起来”,怎么才能在越来越“卷”的科研界脱颖而出,获得有价值的科研方案和研究数据,成为了困扰绝大部分研究者的大难题。

•如何盘点大量的测序和生信基础数据?
•如何基于已有材料和研究目的,匹配有针对性的研究方法?
•如何层层深入、抽丝剥茧、彼此贯通、相互印证并最终对相关问题提出有建设性的回答?如何个性化地设计研究方案和展示研究结果?
这,才是考验研究人员功力的重点和难点,也是高质量文章的核心!

上海唯那生物专注于微生物研究,一直以微生物个性化分析方案定制服务著称,团队扎实的理论积淀和极其丰富的项目经验,已然成为了微生物研究领域的一面旗帜。
唯那生物旗下公众号“密码子实验室”持续分享微生物研究专业技能资料,“密码子学院”平台中发布了大量专业技能课程,唯那团队,一直用专业技能为科研工作者赋能!

【关注我们】 



Part1


 

细菌基因组的变异离不开对基因组结构的变异,如上篇文章(【微生物数据个性化分析及挖掘系列】进化分析:重组对遗传距离的影响)中提到的重组,会对基因组的结构产生影响,进而对基因的遗传环境、表达代谢等造成影响,最终可能对菌株的遗传表型等造成影响,而重组本身也是一种进化的机制,是研究的重点之一。


在基因组结构研究中常用的一种研究方法、或者变异的可视化方式就是比较基因簇。适用于以下研究:
染色体结构变异,如插入缺失等
基因组的同源比较
杂合质粒溯源分析
关键基因遗传环境分析
基因簇结构变异分析
重组位点分析
可移动元件分析

……………………

只要是研究和基因组结构变异相关的,基本都已用这个方法。


      今天就以文章中的几个案例为例带大家一起看看这个方法的不同应用场景。


Part2


 

案例一:这张图属于最基础的基因簇结构分析图,不过特点在于它由两幅基因簇图拼合而成。上半部分解释了一种现象,即图中显示约260 kb的MRCP结构插入并打断了sliE基因;下半部分具体展开该插入结构骨架区以外的左右两端可变区结构,并使用凝胶电泳验证了该结构的存在。通常当我们需要同时说明基因簇整体的构成情况和局部的细节特征时,就可以采用这一种展示方式,相当于将一部分结构进行了局部放大,当然我们也可以选择将其拆分成两张图。

图1染色体MRCP的结构和位置分析

doi: 10.3389/fmicb.2022.846954


案例二:基因簇如果要做成组图,最优先的应该就是比较基因组圈图,特别是对于单基因簇结构展示而言,就如图2所示。除此之外,基因簇也可以和进化树组合,毕竟进化树旁边真是加什么都行啊。  

图2 mcr-8.2携带质粒的圈图和遗传背景

doi: 10.2147/IDR.S256544

图3 黄曲霉毒素生物合成基因簇的比较

doi: 10.1016/j.ijfoodmicro.2022.109859


案例三:这张图的展示方式比较少见,作者是按不同耐药基因来分别展示各菌株相关的基因簇情况的,由于篇幅限制,图中基因的标注主要放在了右侧。从组成上来看,就相当于把多个结果按照列表的方式重新进行了布局,难度不高,适合样本数量相对较少,研究基因在基因组上较为分散的情况。

图4 多种耐药基因及整合子的遗传环境

doi: 10.1186/s12864-021-08279-6


案例四:图5和图6两张图都用来说明融合质粒的形成过程,它们的基因簇绘制本身属于常规作图的范畴。但为了更好地解释这个过程,作者额外添加了原理图,这不仅使得基因簇的分析结果更加丰富,也让文章的解释更加清晰易懂。包括环状中间体的图示化说明等也属于这一类型,都是为了更好地说明结果。对于这一类型的结果展示,基因簇的绘制反而是最简单的,主要是要找准合适的参考序列,真正的难点在于研究者要完全吃透研究中基因簇结构的变化规律,并将它具象化,手工绘制原理图。

图5融合质粒pCRKP-08_KPC_Vir的基因组分析及遗传模型

doi: 10.1016/j.scib.2023.10.038

图6 blaNDM-5质粒和mcr-1质粒的重组整合

doi: 10.1038/nmicrobiol.2016.176


案例五:下面这张图7很明显分析的是blaNDM基因的遗传背景,但与常规基因簇比较分析不同的是,这项研究包含了大量的样本数据,体现的是样本NDM遗传模式的多样性。于是为了更好地展现所有样本的结构特征,将它们囊括在一张图中,作者把它们分为了3种类型,每一种类型的结构大致相同,不同的样式则标注具体的样本数信息,同时使用扇形图来统计各种基因簇类型的来源情况。这项分析的难点在于要把所有样本的基因簇结构先整理清楚并进行归类,只有理顺了整个结果展示的逻辑才能开始绘图,所以虽然最终结果只有一张图,但它是要经过许多前期的数据准备和处理的,可并不容易呢。

图7 分离株NDM的遗传环境模式(Type I、II、III)

doi: 10.1038/nmicrobiol.2016.260


所以我们应该如何绘制个性化的分析图呢?重点还是要多看多积累,当大家有了自己的理解,就可以形成自己独特的风格,应对不同的数据类型也可以更加灵活多变。
如果大家没有思路的话,不妨联系我们试试,上海唯那生物专注于做微生物组学研究和个性化生信分析,4年来已经为数百个课题组解决了个性化数据文章发表的需求,依据研究者数据类型和研究目的的差异,我们会提供不同的个性化分析方案;另外,我们也把各类经验和个性化分析的技能,加工做成了不同的课程,如果各位老师想要自己学习如何做个性化数据挖掘的话,也是一个不错的方向哦。

比较基因簇分析常用的软件是Easyfig,大家需要学习如何使用该软件可以看我们密码子学院上的Easyfig系列课程,以下是该课程的内容和链接:

《基因组结构分析神器Easyfig实操精品课》


Part3


 

            常见个性化分析包括以下几个类型:
                      1、群体进化数据挖掘
                      2、个体差异比较分析
                      3、耐药和毒力深度研究
                      4、泛基因组和GWAS分析
                      5、多组学联合分析
                      6、菌群相关性网络图分析


密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章