背景知识
密码子在生物体遗传信息的mRNA到蛋白质的传递过程中起着关键作用,编码20种不同氨基酸的密码子共61种,其中2种氨基酸(Met和Trp)由一种密码子编码,18种氨基酸由2种或2种以上的同义密码子(synonymous codon)编码,这种现象称为密码子简并性(Degeneracy),同义密码子通常只在第三位碱基上不同(摇摆性)。
不同物种、组织或基因对同义密码子的使用频率呈现出丰富的多样性,即同义密码子偏好性(synonymous codon usage bias,SCUB)。
密码子使用偏好性普遍存在于生物界,在绝大多数基因(基因组)中都已经发现了同义密码子使用偏好性。
标准密码子表
扫描二维码跳转文章界面
研究密码子偏好性的意义
一、了解物种遗传信息的传递规律
对密码子的使用情况进行分析有助于研究不同物种的进化和环境适应性。
不同物种或者同一物种的不同基因之间的密码子使用情况可能不同,表明这些基因组以及基因进化过程中承受的压力不同。研究密码子的使用模式,对于探明物种进化压力以及进一步的遗传研究都有重要的意义。
二、提高异源基因表达水平
外源基因表达量的提高有助于对现有物种的改良、新基因的精准预测,同时对加快功能基因组学以及系统发育学等方面都具有重大意义。
下面介绍几个常用的评价密码子偏好性的指数
同义密码子相对使用度(Relative synonymous codon usage, RSCU)
密码子适应指数(Codon adaption index , CAI )
有效密码子数(Effective Number of Codon,Nc)
Frequency:该密码子在编码总基因密码子中出现的频率。
同义密码子相对使用度(Relative synonymous codon usage, RSCU)
指对于某一特定的密码子,在编码对应氨基酸的同义密码子间的相对概率。该值的计算方法为某一密码子所使用的频率与该密码子所编码的氨基酸的所有密码子平均使用的次数之间的比值,如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然 。计算公式如下
Xij是编码第i个氨基酸的第j个密码子的出现次数
ni是编码第i个氨基酸的同义密码子的数量
密码子适应指数( Codon adaption index , CAI )
该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完全使用高表达基因中所用的密码子 , 则其C AI 值为 1 。目前这个指数已被广泛用来预测基因的表达水平。
CAI指具有物种特异性,不能用于物种间的比较。
Effective Number of Codon(ENC/Nc)有效密码子数
指基因中使用的有效密码子的数量。该值反映同义密码子非均衡使用的偏好程度。
与C AI 不同 ,Nc反应的是某个基因的密码子偏好程度 , 如果一个基因平均使用每一个密码子 ,则其 Nc 为 61 ,如果一个基因只使用每组同义密码子中的一个 ,则其 Nc 为 20。ENC值越低,说明密码子使用偏好性越强。
一般认为,当ENc≤35,则该基因具有显著的密码子偏好性。Nc是评价基因整体密码子偏好性中最具有参考价值的参数。可以通过比较Nc值来确定内源基因表达量的相对高低。通常高表达基因的密码子偏好程度大,其Nc值较小;低表达基因则含有较多种类的稀有密码子,其Nc值较大。
Franction、Frequency
如cusp的分析结果中,第三列为每个密码子的Franction,第四列为Frequency,那是什么意思呢?
Franction表示各个密码子在编码该氨基酸的密码子中所占的比例,即Franction=某个密码子出现的次数/该密码子编码的氨基酸的所有密码子出现的次数。
Frequency表示该密码子在编码总基因密码子中出现的频率,一般表示为在1000个密码子中该密码子出现的次数,即Frequency=某个密码子出现的次数*1000/基因所有密码子总数
Cusp分析结果
课程《遗传密码子偏好性研究》主要介绍密码子偏好性研究相关,从理论到实践,从基本介绍到专题研究,从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案。
https://college.mimazi.net/course/article-7.html