这是2013年Samuel A Clark和Julius van der Werf发表在methods in molecular biology上的一篇介绍gBLUP的方法性文章。作者先后介绍了RR-BLUP和gBLUP模型,然后说明了二者的等价性,并列举了三种构建基因组关系矩阵(GRM)的方法,最后介绍了gBLUP预测育种值的原理。
具体内容如下:
1、RR-BLUP
RR-BLUP的模型为:
是n×1的表型值向量。 是全为1的向量。 是表型均值,是标量。 是n×m的基因型关联矩阵,n是个体数,m是标记数。 是每个SNP的效应值。 是n×1的随机残差向量。
gBLUP的模型为:
是n×1的表型值向量。 是n×p的固定效应设计矩阵。
是p×1的固定效应系数向量,p表示固定因子的个数。
是n×n的随机效应设计矩阵,是对角线为1的单位矩阵。
是n×1的随机效应向量,表示个体的加性遗传效应。
是n×1的随机残差向量。
3、构建基因组关系矩阵(GRM)的方法
构建一个n×m的映射矩阵M,n是个体数,m是标记数。
将主等位基因纯合体编码为-1、杂合体编码为0、次等位基因纯合体编码为1。
构建一个与M相同大小的矩阵,每一列的元素为,是位点的最小等位基因频率。
减去得到(在VanRaden的原文中为),矩阵即为RR-BLUP中的基因型关联矩阵。
计算基因组关系矩阵。
4、RR-BLUP与gBLUP的等价性
gBLUP有三个重要的特性,这些特性使得它比RR-BLUP更值得使用。(1)混合线性模型方程中,随机效应的方差维度从RR-BLUP中的m×m(其中m是标记数)降低到n×n(其中n是个体数)。(2)可以用传统BLUP中的亲缘关系矩阵A替代基因组关系矩阵G,进而计算个体基因组估计育种值(GEBV)。(3)gBLUP中的基因组信息可以通过单步法与谱系信息结合。实际上,gBLUP和RR-BLUP某些情况下是等价的模型。
相应的RR-BLUP的模型为:,该模型的表型方差(假设每个SNP效应的方差相等)。
5、使用gBLUP预测育种值
、、和是GRM的四部分:表示有表型值个体间的基因组关系,和表示有表型值个体与没有表型值个体之间的基因组关系,表示没有表型值个体间的基因组关系。
是有表型值个体的育种值,是没有表型值个体的育种值。无表型个体的估计育种值为:
这是先用gBLUP得到有表型个体的估计育种值,然后利用对进行基因组回归预测。