iTOL的样本与分支名称问题

学术   2024-09-09 08:44   上海  

在进行iTOL注释时,第一列填写的往往是样本或分支的名称,因为所有注释的内容都需要对应到特定的样本或分支,所以样本和分支名称准确与否尤为重要。

关于样本名称(两项基本原则)

① 样本名称必须与提交的树文件保持一致

最容易出现的是符号不一致的情况,特别是构建进化树时的序列文件名称与整理注释数据时的样本名称不匹配,比如类似“PA-1”、“PA_1”、“PA 1”的问题 。然后就是Genbank或Assembly号不匹配,比如像“KP347127”和“KP347127.1”,以及 “GCA”和“GCF”等情况。
不过这个问题很容易发现,因为当注释数据中存在树文件没有的样本时,iTOL会进行报错;而注释文件中缺少树文件的某个样本时,该样本的色块也就无法在图中进行展示。

② 样本名称不能携带模板中设定的分隔符(仅针对于模板注释)
假设模板设定的分隔符是空格,样本名称为“E. coli SHP45”,由于空格的存在,样本的“E.”、“coli”和“SHP45”将被认为是三个组分而无法正常识别。关于这部分的内容可以查看 “iTOL模板组成结构解析”。
若要解决这个问题,有两种方法,一是根据样本的名称选择合适的分隔符,比如将分隔符由空格更换为Tab或逗号;二是修改样本名称同时修改进化树, 比较合适的做法是将空格替换为“_”,因为“_”在iTOL中是一种比较特殊的符号,它不会显示在图中,也就是将其内在修改为“E._coli_SHP45”的形式,但在表观上仍显示为“E. coli SHP45”, 这样就避免了空格与分隔符的矛盾。但从原则上来说,修改分隔符是更加一劳永逸的做法。

关于分支名称(两种表示方法)

① 以分支节点ID作为分支名称
如果生成的进化树里面本身就存在分支节点ID,可以直接填写该名称。

如果生成的进化树里面不包含分支节点ID,可以在iTOL生成的树形图中点击对应的分支,选择“Copy node ID”,并将其粘贴于其它位置,比如txt文件,查看其分支节点ID。

② 以分支节点两侧的样本名称表示分支名称
如下图所示,“|”、“---”可用于表示分支。其特点是从节点两侧的下游分支中各取一个样本作为这一侧分支的代表。比如INT1这个节点一侧是Gallus_gallus,另一侧包含剩下的4个样本,就可以选择其中1个来进行表示,这就是为什么“Gallus_gallus|Homo_sapiens”能够代表INT1这个分支。

关于iTOL网站应用的更多内容可参考我们下方推荐的课程《微生物菌群研究必修课:从深入理解到灵活应用》。


推荐课程
课程《精通系统发育树美化与数据可视化:iTOL实战全攻略》专为进化树的美化加工和各类数据的关联分析展示需求而设计,深入探讨和挖掘iTOL网站的强大功能。课程从进化树的基本构建方法、模型选择、结果解读和拓扑结构的基本展示入手,层层递进,涵盖了添加和优化各类注释信息等复杂操作,支持多种风格的进化树美化展示,成图结果,可直接用于专业级高水平科研杂志的文章发表,有助于大幅提升数据的视觉效果和解读价值。

主要内容:

进化树理论知识:剖析进化树的类型、生物学意义,掌握常见算法及其结果解读。

iTOL基础操作:学习数据上传、基础设置及结果导出的完整流程。

标签与样式调整:掌握标签信息修改、样式设定、分支样式调整及clade分组的应用。

特征信息可视化:深入了解如何通过条带、符号、热图等形式展示样本背景或基因组特征信息。

统计数据可视化:实操讲解柱状图、堆叠图、饼图及关联性图表的应用,提升统计数据的表现力。


(扫码看课)


密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章