趋势分析是我们寻找目标基因/蛋白/代谢物的常用方法之一。Mfuzz和STEM是趋势分析的两种常见软件。其中,Mfuzz是基于模糊c均值聚类(Fuzzy C-Means Clustering, FCM)算法进行聚类,也叫soft clustering算法[1];相比于K-means等hard clustering聚类方法,一定程度上降低了噪声对聚类结果的干扰。此外,相比于STEM预先设定出可能存在的代表性趋势,再将数据归类到与其最相似的趋势中[2];Mfuzz通过模糊聚类算法来确定每个数据隶属于各个趋势的程度(即membership值),而不是将数据对象硬性地归类到某一个趋势中,在分组数量较多时能够更精准捕获数据的代表性趋势。
基迪奥Omicsmart在线报告(www .omicsmart.com)趋势分析已全面升级,包括转录组、蛋白组、代谢组、翻译组等,在原来STEM趋势分析的基础之上新增了Mfuzz软件的分析结果,而且支持对实验组和对照组样本进行双组趋势分析。下面一起来看看升级后的趋势分析该如何使用吧!
一、开始交互分析
图1 趋势分析参数选择
趋势分析本身涉及很多参数,但在Omicsmart在线报告中,我们只保留了最核心的参数,免去冗余参数的困扰。
模块数量:即趋势分析设置的趋势数量,默认值为10,可自定义修改。
单组趋势分析
可选STEM和Mfuzz,STEM更适合分组数量较少的情况(3-5组),分组数量较多时可以选择Mfuzz。在设置好分组方案之后,将多个分组按照梯度进行排序(如按照时间或者试剂浓度排序),通过趋势分析将变化模式相似的基因/蛋白/代谢物归类到一种趋势中。默认对数据进行log2标准化,P值 < 0.05 的趋势被认为是显著趋势。
双组趋势分析
在生物学实验中,我们经常会遇到两组比较(比如实验组和对照组)的情况,这时可以使用Mfuzz进行双组趋势分析。在处理趋势组按顺序排列好处理组(如EG1、EG2、EG3),在对照趋势组按相同的顺序排列好相应的对照组(如CG1、CG2、CG3)。其分析流程为计算上下对应的处理趋势组和对照趋势组数据的差异倍数,筛选至少在一个趋势组里差异倍数大于2的基因/蛋白/代谢物,最后取差异倍数的log2值进行趋势分析。
二、结果解读
我们之前已经介绍过STEM趋势分析的结果,因此接下来给大家详细解读一下Mfuzz趋势分析的结果图(以转录组为例)。其本质上是由不同趋势的折线图组成,图片最上方是趋势的名称和趋势内基因的数量,同一张子图内的基因具有相似的表达模式。
1)其中横坐标代表不同的分组,纵坐标为标准化的基因表达量;
2)每条折线代表一个基因,根据membership值对其进行着色;
3)黑色折线为整体趋势线,其它颜色的虚线为选中的目标基因趋势线。
Tips:Membership值表示基因与聚类中心的相似性程度,范围在0到1之间。低membership值表示该基因在该趋势中的表现不佳,较高的membership值表明该基因的表达与该趋势中心高度相关。根据membership值可以帮助我们识别聚类的核心基因。
图2 Mfuzz趋势分析结果图解读
除了全部趋势外,还可以单独查看单个趋势的结果图:
图3 Mfuzz趋势分析单个趋势结果图
三、特色操作
我们的Omicsmart在线报告提供了非常多的参数以方便大家对图形进行个性化的调整,比如在图中显示每个趋势最具代表性的基因、更换membership阈值进行绘图等,下面跟着我一起操作起来吧!
1
图表交互
在数据列表处可以根据GeneID进行筛选;或者根据Cluster进行筛选,然后点击Membership,将其从大到小进行排序,从而选择在某个趋势内membership值最大的数据进行展示(即该趋势最具代表性的基因)。选中的数据在图中会以不同颜色的线段显示,可以在图形设置里面自定义修改目标线段类型和配色方案。
图4 如何筛选并显示目标基因
2
更换阈值绘图
点击更换阈值绘图,可以重新设置Membership的阈值(范围在0-1之间,默认为0,即全部绘制)。点击重新运行,Membership值低于该阈值的基因将被筛选掉然后重新绘图,同时数据列表也会随着阈值的更改而发生相应的变化。
图5 如何更换阈值绘图
3
编辑趋势
在编辑趋势处,可以通过拖拽改变趋势位置,双击删除趋势;也可以单击选择趋势,在改变名称处修改趋势名称,点击保存即可重新绘制图形。
图6 如何编辑趋势
4
自定义配色方案
在图形设置中,可以修改图片整体的配色方案,也可以自定义修改颜色。
图7 如何修改配色方案
以上的修改都是实时调整的,在修改完成之后,可一键下载不同格式的图形(svg、pdf、png等),直接用于文章发表!
四、下游分析
通过趋势分析挖掘到具有相同表达模式的基因后,我们可以对这些基因进行进一步的分析,如GO和KEGG富集分析等,来查看这些基因显著富集的生物学过程,从而帮助我们挖掘核心基因和回答生物学问题。
1
生成新基因集
在趋势分析的数据列表处点击生成新基因集,可以根据选择的基因个性生成基因集,也可以批量选择某个趋势内的基因生成基因集,输入新基因集名称,点击确定,创建好用于后续分析的基因集。
图8 如何根据趋势分析结果生成新基因集
2
基因集富集分析
在目标基因分析处选择好分组方案和刚才设置好的目标基因集,输入任务编号,选择富集分析,创建目标基因集的富集分析任务。任务完成后在对应的分析结果处查看富集分析结果。
图9 目标基因集富集分析结果
总 结
Mfuzz是一款用于趋势分析的强大工具,我们的Omicsmart在线报告不仅支持Mfuzz单组和双组趋势分析,还能够对分析结果进行个性化的调整并筛选结果用于下游分析,大大简化了数据挖掘的流程,大家赶快用起来吧!
参考文献
[1] Kumar L, Futschik M E. Mfuzz: a software package for soft clustering of microarray data. Bioinformation, 2007, 2(1): 5.
READ MORE
延伸阅读
*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。