【毕业论文系列】为何密码子偏好性指数ENC(Nc)计算结果为空?

学术   科学   2024-11-25 14:18   上海  

在之前的软文中(【毕业论文系列】密码子偏好性研究—常见指数)我们介绍了评价密码子偏好性的指数,在我们全套的密码子偏好性的课程中(【课程】遗传密码子偏‍好性研究)我们系统介绍了各类指数的含义、计算绘图和文章应用。

最近有客户反馈了一个问题,使用codonW分析得到的.out文件中,有一个基因的ENCNc)值是星号,如下图:

Codonw输出结果文件.out

系统提示信息如下:

系统提示的原因是该基因中不包含含有8个同义密码子的氨基酸,该基因使用的密码子表是table5https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?chapter=tgencodes#SG5)在codonw中对应4号密码子表,在该密码子表,含有8个同义密码子的氨基酸只有1Ser
下表是该基因对应的RSCU值(.blk文件):

Codonw输出结果文件.blk

由上表我们可以看到,在该基因中有4Ser,对应4个不同的密码子:UCU1)、UCA1)、AGU1)、AGA1),总之,该基因中包含具有8个同义密码子的氨基酸,为何提示没有呢?

那就要知道ENC的计算原理,大家可以详细阅读一下参考文件(DOI: 10.1016/0378-1119(90)90491-9),此处我们简要说下大致原理。

首先计算每个氨基酸的纯度(Homozygosity),可以简单理解为频率,计算公式如下

公式1

n表示氨基酸出现的数目,为所有同义密码子数量的加和(n=n1+n2+……+ni),pi表示第i个同义密码子的频率(pi=ni/n),k是同义密码子的种类。

每个氨基酸都会得到上面这个值。

基于上述结果,计算每条基因的ENC值,ENC计算公式如下:

公式2

在计算ENC的时候,会根据密码子表将所有的氨基酸进行分类,比如根据table12个氨基酸(MetTrp)具有1个密码子,9个氨基酸(PheTyrHisGlnAsnLysAspGluCys)具有2个同义密码子,1个氨基酸(Ile)有3个密码子,5个氨基酸(ValProThrAlaGly)有4个同义密码子,3个氨基酸(LeuSerArg)有6个同义密码子,共5个组,分别命名为SF1SF2SF3SF4SF6.
上述公式中的就是SFi组所有氨基酸的平均值。
这就是codonW计算ENC值得原理。



再回到刚开始的问题就很好理解了,因为在该序列中,对应table5,属于F8组的氨基酸只有1Ser,共4ser,且分别对应4个不同的密码子,即UCU1)、UCA1)、AGU1)、AGA1),那么公式1的分子为0,公式2中对应该组的分母为0,所以该氨基酸(SER)被认为不存在,所以对应这条序列的ENC值就不被计算,结果中就以**表示

来自DOI: 10.1016/0378-1119(90)90491-9

关于这个问题大家还有什么疑问或者看法欢迎讨论~



相关课程推荐

课程《遗传密码子偏好性研究》主要介绍密码子偏好性研究相关,从理论到实践,从基本介绍到专题研究,从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案。

扫描下方二维码或根据链接获取课程

https://college.mimazi.net/course/article-7.html


密码子实验室
我们一直坚持认为,让知识更有价值,让科学研究更简单,让实验室管理更智能化,让每一个热爱学习的人更有效率,是我们的使命。生物信息学实操、实验操作技能、科研绘图技巧、行业动态播报,这里只有干货。
 最新文章