使用MEGA 11完成多序列比对以及构建系统发育树!

文摘   2024-12-26 19:28   江苏  

系统发育树(Phylogenetic tree)又称为演化树(evolutionary tree),是表明被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法(cladogram)。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。


以下内容分享了如何利用 MEGA 11软件完成多序列比对以及构建系统发育树


1、Mega 11软件安装

安装包下载:在科研根号三公众号回复“ 软件131 ”下载MEGA 11 安装包。


双击【MEGA_11.0.11_win64_setup】开始安装。



选择I accept the agreement,点击Next,选择软件安装位置。



点击Next,然后勾选Create a desktop shortcut(创建桌面快捷方式),点击Next。



点击Next,点击Install



等待一会安装结束,点击Finish。




2、下载多序列文件

序列文件的下载步骤为:进入NCBI官网(https://www.ncbi.nlm.nih.gov/nuccore/),选择Nucleotide核酸数据库,输入目的基因名称点击search。在弹出的页面中,选择物种类别,以及核酸类别。然后对弹出的页面信息进行初步甄别,看是否是我们需要检索的内容。


确定后在右侧菜单中,物种筛选人类,以此来缩小检索范围。



找到目的基因条目后,点击打开,页面一直往下翻,找到CDS,点击CDS按钮,点击右下角FASTA进入下一页面。




点击send to,选择Complete Record,选择File,下载项选择FASTA,最后点击Create File将序列文件下载到电脑本地。



也可以使用NCBI数据库中的BLAST在线工具(https://blast.ncbi.nlm.nih.gov/Blast.cgi)得到同源序列并下载完整的FASTA序列。


在上一个页面直接点击右边工具栏中的--Run BLAST,直接跳转到BLAST工具页面。



点击BLAST按钮,开始检索同源序列。



跳转到这个页面之后需要等一会才会出现结果页面,在线检索结果需要时间。



之后出现的这个页面就是显著对齐序列的结果页。找到自己感兴趣的序列,可以多选条目,点击Download--FASTA (completesequence),下载序列文件。




3、多序列比对

在NCBI下载的序列,文件扩展名是【.txt】,我们需要将文件扩展名更改为【.fas】,这样才能才MEGA内打开这个文件。如果你是把序列保存到word内了,也是直接将文件的扩展名更改为【.fas】。



打开MEGA软件,菜单栏File--Open A File/Session,打开蛋白序列文件。




在弹出的对话框选择Align。




接下来对齐序列。菜单栏点击Alignment--Align by MUSCLE。



在弹出的对话框选择【OK】。



设置保持默认,然后点击【OK】。



等待一会,序列就对齐啦。得到比对好的结果,下一步就是构建进化树。





4、构建发育树

菜单栏点击 Data --Phylogenetic Analysis,MEGA会开始转换发育树构建的文件,随后关闭窗口即可。



回到 MEGA 主窗口。选择 Analysis ,选择 Phylogeny 中的某一项,即可开始建树。




4.1 Construct/Test Neighbor-Joining Tree--构建 NJ 树


定义:生物进化距离,邻接法。
方法:邻接连接将距离矩阵作为输入,指定每对分类群之间的距离。该算法以完全未解析的树开始,其拓扑对应于星型网络的拓扑,并迭代地将相邻点合并成新的点(相邻是指两个分类单位在某一无根分叉树中仅通过一个节点相连),直到树完全解析并且所有分支长度都已知。
特点:优点就是速度快,所以可以快速分析大型数据集。



接下来调整参数:(有些参数需要按个人需求修改)
  • Test of Phylogeny(发育测试方法)选择Bootstrap method(鲁棒性测试方法)
  • No. of Bootstrap Replications(检验次数)修改为1000
  • Substitutions Type选择Amino acid
  • Model/Method选择Jones-Taylor-Thornton (JTT) model
  • Gaps/Missing Data Treatment(修剪方式)选择Pairwise deletion
  • Number of Threads选择8



以下Tree Explore是发育树构建完成的结果页面。在这个窗口可对发育树进行调整或美化。如更改字体和字体的颜色、给不同分支做标记。



左侧Layout中可快速调整树的宽度和高度,点击Tree Style或菜单栏View—Tree/Branch Style可选择不同的树样式。






4.2 Construct/Test Maximum Likelihood Tree--构建ML树


定义:统计特征,最大似然法。
方法:选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树(所以分析时间比较长)。
特点:最大似然法具有很好的统计学理论基础,是一个比较成熟的统计学方法。选择合理的模型后,最大似然法可以推导出一个效果很好的进化树结果。但是对于相似度很低的序列,NJ往往出现Long-branch attraction(LBA,长枝吸引现象),有时严重干扰进化树的构建。
构建ML树的方法和构建 NJ 树的方法一样,只是分析时间比较长。




5、导出进化树文件

导出为Newick格式,之后可以在iTOL,Evolview,Figtree等工具中对发育树进行更细致的调整,比如添加分类颜色,标记,和条形图、热图的组合等。



也可以通过Image菜单导出SVG或PDF格式的矢量图,一般来说SVG的清晰度更好。之后可以用Adobe illustrator软件对发育树进行底色的添加。




往期内容推荐



科研根号三
科研虐我千百遍,我待科研如初恋!这里有你关心的科研干货、资讯、软件、工具等。期待为同样热爱科研的你提供方便!
 最新文章