PR2分析,全称为parity rule 2,有的人也叫奇偶偏好分析,是研究密码子偏好性影响因素中常用的分析之一,其他的分析还有Neutrality curve(中性绘图)、ENC plot、COA(Corresponding Analysis)等。
今天我们来讲讲PR2分析
PR2分析通过 A3S、T3S、G3S、C3S(分别表示密码子第三位碱基的A、T、G、C含量)分别计算 AT-bias(A3S /(A3S+T3S))与GC-bias(G3S/(G3S+C3S),利用二者的对应关系来分析选择和突变对密码子使用模式的影响,常见的结果如下图所示:
https://doi.org/10.1016/j.gene.2021.145866.
很多人在做图的时候直接使用CodonW或者其他软件脚本计算的值,而小编查看了一些大家使用的脚本软件,无一列外的都是统计了完整基因序列的A3、G3、C3、T3,这显然是不对的,当然codonW的结果也不能直接用,原因下次再给大家讲。
为什么呢?那应该怎么做呢?
首先来看PR2的理论基础,如下图所示,当突变和选择作用对DNA双链的影响没有偏好性时,W链上的A->T替换速率r1等于互补链(C链)中T->A的替换速率r2’,即r1=r2’;同时,C链中的A->T替换速率r1’等于W链中T->A替换速率r2,即r1’=r2。已知在无链偏好性的情况下,两条链中A->T的替换速率相等,即r1=r1’,那么r1=r2=a,同理可以得到其他碱基对的替换速率一致,所以,在不存在DNA链偏好性的情况下,每条DNA链中A=T,G=C,这就是PR2的理论基础。
Fig. 1. Substitution rates between all four bases within a strand of double-helix DNA
想深入了解,推荐大家2篇经典文献
Sueoka N. Intrastrand parity rules of DNA base composition and usage biases of synonymous codons. J Mol Evol. 1995 Mar;40(3):318-25. doi: 10.1007/BF00163236. PMID: 7723058.
Sueoka N. Translation-coupled violation of Parity Rule 2 in human genes is not the cause of heterogeneity of the DNA G+C content of third codon position. Gene. 1999 Sep 30;238(1):53-8. doi: 10.1016/s0378-1119(99)00320-0. PMID: 10570983.
那么回到密码子偏好性的研究中,通过PR2分析我们就可以分析影响密码子偏好性的因素只有随机突变(此时密码子A3=T3,G3=C3)还是突变和选择共同作用(此时密码子A3≠T3,G3≠C3)。那么,基于它的理论基础,在进行PR2分析的时候应该选择具有4个简并同义密码子的氨基酸(four-codon degenerate amino acids )进行计算,此时的PR2最具有意义,因为这些密码子第三位的ATGC相等(对称),保证相同的替换速率。也可以选择所有对称的同义密码子,包括four-codon and two-codon amino acids,此时也就有一定的意义。一般会在坐标上标注所选用的氨基酸,如选用four-codon ,则横纵坐标分别标注为A3/(A3+T3)|4 和G3/(G3+C3)|4,如选用four-codon and two-codon,则分别标注为A3/(A3+T3)|2&4 和G3/(G3+C3)|2&4,如下图
DOI: 10.1016/s0378-1119(99)00320-0
以密码子table1为例,应该选择序列中红框标注的这8个氨基酸对应的密码子进行计算。
如果所研究物种使用的不是标准密码子表,如昆虫线粒体使用table5,那么应该根据规则选取对应密码子表中的氨基酸。首先对基因序列进行处理,在进行统计和绘图,切记不要随便拿到一个数字就分析。
课程《遗传密码子偏好性研究》主要介绍密码子偏好性研究相关,从理论到实践,从基本介绍到专题研究,从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案。
https://college.mimazi.net/course/article-7.html