【毕业论文系列】为何密码子偏好性指数ENC(Nc)计算结果为空?
学术
科学
2024-11-25 14:18
上海
最近有客户反馈了一个问题,使用codonW分析得到的.out文件中,有一个基因的ENC(Nc)值是星号,如下图:Codonw输出结果文件.out
系统提示信息如下:
系统提示的原因是该基因中不包含含有8个同义密码子的氨基酸,该基因使用的密码子表是table5(https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?chapter=tgencodes#SG5)在codonw中对应4号密码子表,在该密码子表,含有8个同义密码子的氨基酸只有1个Ser,
Codonw输出结果文件.blk
由上表我们可以看到,在该基因中有4个Ser,对应4个不同的密码子:UCU(1)、UCA(1)、AGU(1)、AGA(1),总之,该基因中包含具有8个同义密码子的氨基酸,为何提示没有呢?那就要知道ENC的计算原理,大家可以详细阅读一下参考文件(DOI: 10.1016/0378-1119(90)90491-9),此处我们简要说下大致原理。首先计算每个氨基酸的纯度(Homozygosity),可以简单理解为频率,计算公式如下n表示氨基酸出现的数目,为所有同义密码子数量的加和(n=n1+n2+……+ni),pi表示第i个同义密码子的频率(pi=ni/n),k是同义密码子的种类。基于上述结果,计算每条基因的ENC值,ENC计算公式如下:
在计算ENC的时候,会根据密码子表将所有的氨基酸进行分类,比如根据table1,2个氨基酸(Met和Trp)具有1个密码子,9个氨基酸(Phe、Tyr、His、Gln、Asn、Lys、Asp、Glu、Cys)具有2个同义密码子,1个氨基酸(Ile)有3个密码子,5个氨基酸(Val、Pro、Thr、Ala、Gly)有4个同义密码子,3个氨基酸(Leu、Ser、Arg)有6个同义密码子,共5个组,分别命名为SF1、SF2、SF3、SF4、SF6.上述公式中的就是SFi组所有氨基酸的平均值。
再回到刚开始的问题就很好理解了,因为在该序列中,对应table5,属于F8组的氨基酸只有1个Ser,共4个ser,且分别对应4个不同的密码子,即UCU(1)、UCA(1)、AGU(1)、AGA(1),那么公式1的分子为0,公式2中对应该组的分母为0,所以该氨基酸(SER)被认为不存在,所以对应这条序列的ENC值就不被计算,结果中就以**表示来自DOI: 10.1016/0378-1119(90)90491-9
关于这个问题大家还有什么疑问或者看法欢迎讨论~
课程《遗传密码子偏好性研究》主要介绍密码子偏好性研究相关,从理论到实践,从基本介绍到专题研究,从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案。
https://college.mimazi.net/course/article-7.html