在密码子偏好性研究中,通常会利用密码子各个位置上的碱基含量来分析影响密码子偏好性的因素,如ENC-plot、ENC-plot、PR2分析等,建议大家在做这些分析之前先了解一下各个分析的原理,最好看看原始的文献,这样才能知道具体选用什么数据去分析了,在一些文章中有点囫囵吞枣,随便捡个数据就来分析了,研究还是要讲究严谨的,这些问题后续找时间再给大家整理一下,大家也可以查看我们的课程《遗传密码子偏好性研究》,都有详细说明。
今天先给大家说一个常见问题。
话不多说,直接上问题:
图(1) codonW计算结果
图(2) cusp计算结果
如上图所示,为同一条序列分别使用codonW和cusp计算的结果,里面都有大家关注的GC3,但为什么同一条序列不同软件的计算结果不一样呢?那么应该用哪一个呢?区别在于两个软件的原理不同:
Cusp:计算的是所提交序列中所有密码子第三位的GC含量(3rd letter GC),和其他的一些脚本运算的结果一致。另外,cusp默认使用标准密码子表,不能更换密码子表。
CodonW:GC3s为同义密码子第三位的GC含量。并不是全部的密码子,这就是结果不同的原因,另外,codonW可以根据所研究的物种选择不同的密码子表,根据不同的密码子表,同义密码子也会发生变化,所以结果也会有所不同。
是不是豁然开朗。
如果要是两者的计算结果一致,根据codonw所选的密码子表,去除序列中的非同义密码子及终止密码子,然后用cusp计算,两者的结果就一样了。
顺便说一下,
codonW里面的A3s、T3s、G3s、T3s也都是各自碱基所对应的同义密码子的第三位碱基含量,如A3s,计算的对象是含有A结尾的同义密码子的氨基酸,计算的是这些氨基酸密码子第三位A的含量,这也是为什么A3s+T3s+G3s+T3s不等于1的原因,因为计算的对象是不一样的,那么自然,在PR2分析中就不能使用codonW计算的结果了。
在《遗传密码子偏好性研究》课程中,我们为大家提供了完整的数据分析,处理以及绘图的方法,以及其他的在密码子研究中常见的问题。
还是要说一下,做研究还是要严谨点,万一发现点什么呢?
课程《遗传密码子偏好性研究》主要介绍密码子偏好性研究相关,从理论到实践,从基本介绍到专题研究,从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案。
https://college.mimazi.net/course/article-7.html