配合力和育种值BLUP为啥为负值,几个意思?

科技   科技互联网   2024-09-13 21:50   河南  

大家好,我是邓飞,作为育种数据分析的段子手,数据分析水平不敢保证,但是段子确实香。经常有小伙伴抛出各种育种数据分析相关的问题,当问题比较多了,我觉得应该写一篇博客了,毕竟,别人问你一个问题,再没有抛过去一篇博客,什么话都不说更爽的了,暗爽。




作为一个资深的水电工,身上带着锤子扳手之类的很正常,作为一个资深的数据分析时,手里面有各种博客用于答疑也很正常。



常见问题:


1,gca和sca都为0,是什么原因?


答:这是因为亲本之间没有显著性差异,配合力分析的前提是方差分析中亲本之间达到显著性差异,要不然gca和sca都没有意义。


2,模型迭代失败,是什么原因?


答:NCII试验,需要有重复数据,否则不能计算gca和sca


3,方差分析和混合线性模型LMM模型有什么区别


答:LMM模型结果更靠谱,而且可以直接计算方差组分,计算广义遗传力和狭义遗传力。当有缺失值存在时,推荐使用LMM模型,相关的包有:lme4,sommer,asreml等。


4,配合力为何有正有负?


答:配合力之和为0,所以有正有负,正的就是高于均值,负的就是低于均值,0就是均值。所以,选择配合力高的,就选择最大的就行。


常见的问题都有了,举个栗子介绍一下如何进行配合力分析吧,毕竟说了一大堆有钱真幸福的话,没有告诉大家如何搞钱显然不是一个合格的安利文。

…………

…………

1. 玉米测交试验

可以认为,玉米侧交试验,是一个NCII的试验,在玉米实际的育种中,由于其测用结合的特性,应用广泛。

试验设计如下:

  • 骨干系:4个 

  • 待测系:7个 

  • 重复:2次 

  • 观测值:产量

「计算目的:」

  • 1 计算待测系的一般配合力(选择最优品系)
  • 2 计算待测系和骨干系的特殊配合力(选出最优组合)
  • 3 了解材料的遗传特性

2. 概念解释

「配合力:」杂交育种成功的关键在于正确选配亲本,因为杂种的表现如何,不仅取决于自交系本身的农艺性状,而且决定于亲本间的相互关系,这种相互关系成为配合力。

「一般配合力(GCA)」如果某一品系与许多品种、自交系杂交,其F1的平均产量成为该品种的一般配合力(GCA)。

「特殊配合力(SCA)」将其中某个特定组合的表型与一般配合力之差称为该品系的特殊配合力(SCA),它反映了两个亲本之间的特殊关系。

「配合力的作用」育种过程中,可以选用一般配合力高的自交系组成轮回群体,以积累加性基因,提高一般配合力。选用特殊配合力高的亲本组配杂交组合,可以通过多基因位点的互作,获得较高的杂种优势效应。

刘纪麟《玉米育种学》 第二版,中国农业出版社 P94

3. 计算流程

  • 1 读取数据
  • 2 查看数据结构,转化为因子
  • 3 构建模型
  • 4 提取配合力结果
# 读取数据
dat = read.csv("NCII_dat.csv")
str(dat)

# 转化为因子
for(i in 1:5) dat[,i] = as.factor(as.character(dat[,i]))
str(dat)

# 构建模型
library(sommer)
mod = mmer(yield ~ Block, random = ~ P1 + P2 + Fam, data=dat)
summary(mod)

# 提取配合力结果
gca1 = mod$U$P1
head(gca1)

gca2 = mod$U$P2
gca2

sca = mod$U$Fam
sca

4.其它参数的计算

「配合力的显著性:」配合力的效应,是效应值(Effect),如果判断显著性,先看方差分析中GCA和SCA是否达到显著性,然后计算每个自交系的GCA的显著性。e

因为GCA是总和为0的效应值,如果判断每个品种的GCA是否是显著的,其实是和0进行的比较,其实是进行的是T检验,可以计算LSD0.05和LSD0.01,比较GCA的值,判断其显著水平。

「狭义遗传力与广义遗传力」

不同近交系数,计算方法是不一样的,感兴趣的老师,可以参考我之前写的博客:如何使用NC II 遗传设计估算配合力和遗传力?

5. 数据介绍

「表型数据:」

6. 结果怎么看?

上面P11P12P13P14为骨干系(测验种),可以看到P12为1.15,最高,说明P12和所有待测系杂交后代的平均值最高,而且比整体平均值高1.15.

注意,这里的一般配合力都是相对于整体平均值的效应值,他们的整体之和为0,为正表示高于整体平均值,为负表示低于整体平均值。

这里的P20~29为待测系,可以看到,P211的一般配合力为2.08,表现最好。

注意,一般配合力,都是针对于自交系本身的,它的值主要是在本实验内才有意义,重点是排名,为了筛选。

上面是特殊配合力的结果,Fam1_5表现最好,它的亲本分别是:P1和P5,说明他们之间的特殊配合力最高。

注意:特殊配合力为两者之间的值,不能讲某个自交系的特殊配合力是多少,要讲两个自交系间的特殊配合力多高。它也是根植于具体的试验,用于筛选排名。

7. 下载示例数据和代码

关注公众号:育种数据分析之放飞自我 

回复关键词:「NC」下载相关数据和代码。

育种 | 如何使用R语言计算配合力




推荐阅读:


1,快来领取 | 飞哥的GWAS分析教程


2,飞哥汇总 | 入门数据分析资源推荐


3,数量遗传学,分享几本书的电子版


4,学习R语言这几本电子书就够了!



上机操作教程搞起:

GWAS最快上手的方法是什么鸭?

育种数据分析之放飞自我
本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
 最新文章