iTOL模板组成结构解析

学术   2024-09-03 08:33   上海  

在使用iTOL注释模板之前,我们先要了解模板的基本原理。如下图所示,在tol_binary这个模板中,所有条目前带有“#”的是用于解释模板内容的说明文本,不参与iTOL注释;而未携带“#”的则是实际参与注释的内容,它们与结果的呈现直接相关。


在理解了这一点后,我们再来看iTOL注释模板的各部分内容。如下图所示,iTOL模板可以由以下四部分内容组成:
① 模板类型:

通常位于模板的第一行。如外周符号注释文件tol_binary的第一行是“DATASET_BINARY”,它规定了该模板在iTOL中用来生成binary数据集。

某些模板虽然填写的内容不同,但它们的模板类型可能相同。比如“colors_dash”、“colors_no_range_tol”和“colors_tol”都为“TREE_COLORS”,这意味着它们生成的数据集属于同一种类型,模板功能的分化来源于所添加的数据类型或方式不同。
② 分隔符设置:

分隔符规定了后面所有内容多个词条之间以怎样的方式进行分隔。比如在上述tol_binary模板中参数设置部分的“DATASET_LABEL,binary_data”将该数据集的名字命名为“binary_data”,两者之间是以逗号作为分隔符的,而同样的其Data原始数据部分的“I149,-1,-1,1,1,0,0,0,0,1,0 ”每两项之间也通过逗号来进行区分。

在iTOL模板中有3种被允许的分隔符,分别是Tab、空格(Space)和逗号(Comma),每个模板只能选择其中一种。tol_binary这个模板默认的分隔符是逗号,所以后面所有内容都用逗号进行分隔。

而分隔符是可以重新设置的,比如我们要将模板的分隔符从逗号更改为Tab,就可以将“SEPARATOR TAB”前面的“#”去除,并在“SEPARATOR COMMA”前面添加“#”。但需要注意的是,分隔符更改后,参数设置部分以及Data原始数据都需要更换为新分隔符的形式。综合来说,最推荐的是Tab,它有利于数据的整理,且不容易受标签名称和颜色设置的影响。
③ 注释内容的参数设置:

参数设置部分的情况因模板而异,不同模板设置的内容是不一样的。这些设置通常都可以在iTOL网页中直接更改,所以大多数情况下我们可以不修改这一部分内容。

然而也有一些iTOL模板是不定项的,比如上述的tol_binary模板,它每多一列Data数据就会在外侧多一个环。在这样的模板中,环标签FIELD_LABELS、环颜色FIELD_COLORS等涉及到环数量关系的参数就必须要进行调整,其它参数可以不动。
④ Data原始数据:

Data部分需要根据我们的注释信息来填入数据,它的格式同样因模板而异。通常第一列是样本或分支的名称,注意该名称与树文件中的名称必须保持一致,任何符号的变化都会使得数据无法正常识别。另外名称内部也不能包含设定的分隔符,否则要么调整模板,要么修改树文件。
后面的各列数据可能包括对颜色、大小、位置、字形、分组标签等内容的设置,具体应该填写什么信息一般在模板中会有示例和说明,根据模板的要求更改即可。比如tol_binary模板从第二列开始每一列是一个环,能够设定的符号仅有“1”、“0”和“-1”三种,不同的数值可以用来表示样本某种基础属性的差异,例如基因的有和无。

关于iTOL网站应用的更多内容可参考我们下方推荐的课程《微生物菌群研究必修课:从深入理解到灵活应用》。


推荐课程
课程《精通系统发育树美化与数据可视化:iTOL实战全攻略》专为进化树的美化加工和各类数据的关联分析展示需求而设计,深入探讨和挖掘iTOL网站的强大功能。课程从进化树的基本构建方法、模型选择、结果解读和拓扑结构的基本展示入手,层层递进,涵盖了添加和优化各类注释信息等复杂操作,支持多种风格的进化树美化展示,成图结果,可直接用于专业级高水平科研杂志的文章发表,有助于大幅提升数据的视觉效果和解读价值。

主要内容:

进化树理论知识:剖析进化树的类型、生物学意义,掌握常见算法及其结果解读。

iTOL基础操作:学习数据上传、基础设置及结果导出的完整流程。

标签与样式调整:掌握标签信息修改、样式设定、分支样式调整及clade分组的应用。

特征信息可视化:深入了解如何通过条带、符号、热图等形式展示样本背景或基因组特征信息。

统计数据可视化:实操讲解柱状图、堆叠图、饼图及关联性图表的应用,提升统计数据的表现力。

(扫码看课)

密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章