你一直做错!用BLAST找同源基因查看功能?

文摘   2024-09-07 18:10   贵州  

海南台风了,办公室电脑只能提前关机。于是我也干不了活了。翻翻一些文献,看到一张图,我觉得很不错。

于是想着,拿来分享最好。我知道,绝大多数人,我的意思是几乎所有人,除非一线且经验非常丰富的人,甚至除非是有开发相关功能工具的人,比如我在 TBtools 里面写的 Find Best Homology,之外,大概率都不会知道,如果你就是基于 BLAST 来查找感兴趣的物种的同源基因?或者是通过最优比对来试图推测基因的功能,是一件多么危险的事情。

下面这张图可以很好说明问题。

其中「query」就是我们的查询序列,而「closest」就是最接近或者你可以认为是相似的序列。显而易见:

A:最优比对可以推断query功能或者分支(实际上,TBtools Find Best Homology 就是这个判断方法,目前似乎还没有人复制 TBtools 这个操作,不过咱们也习惯被复制了);

B:从树的枝长信息就可以看出,query 对应的最优比对,其实属于更祖先的节点,而不是他归属的节点,为什么?因为演化速率的问题。这种情况,你可能就无法知道specific的功能了;

C:显而易见,最优比对其实是另外一个分支的;

D:B和C的问题其实都是分支演化速率变化导致的。但是D图的,那么其实query的最优就是四选一,然而每两个可能就是不同功能。所以......query 是这四个的最优同源吗?这就很难说了。

写在最后

好,今天就分享这么多。说实话,你真的应该用 TBtools 的 Find Best Homology,这个简化了太多操作,同时给你“正确”答案。你知道,很多软件会给你很大参数,他们并不想直接给你正确答案。但是,是否有必要?这是一个问题。


生信石头
记录和分享生信学习经验和数据处理技巧
 最新文章