当这个东西并非科研而是作业的时候,上哪里找同源的序列进行比对呢?
不知道大家有没有被这个问题困扰。
其实很简单接下来以ALA为例。在NCBI中搜索ALA可以得到以下信息。
以ala alanine dehydrogenase [ Archaeoglobus fulgidus DSM 4304 ]为例
滚动下滑,找到General gene information/Homology
点击进入,你就能看到相当之多的直系同源的信息
一般选择比较蛋白质序列比DNA更好
蛋白质序列短而且含有的20种氨基酸信息比DNA有的的4种核苷酸信息更多
选用10-15条序列,把它们下载下来,就可以扔进Mega里面进行比对了
但很多工具善于比对总长度类似的序列,对长短不一的分析结果并不理想,可能会存在需要手动对齐的情况
当然如果不想下载软件也可以使用在线的ExPASy-Clustal W,ExPASy可以直接将数据发送到多序列比对MSA的页面,MSA网页又可以直接将比对结果发送到系统发育分析的网页
我自己比较喜欢用mega,因为mega不用倒过来倒过去的。当然要是喜欢用Clustal,、MUSCLE、T-Coffee和MAFFT那就更是大牛,当没看见这个文章就好了哈哈哈哈哈哈哈
至于如何建树大家可以参考知乎大佬写的这篇文章,相当详细:MEGA-X | 选择模型构建进化树(超慢的~) - 知乎 (zhihu.com)点击原文即可跳转过去了~