什么是估计育种值的BLUP法?它有何优点?

Python013

什么是估计育种值的BLUP法?它有何优点?,第1张

BLUP是Best Linear Unbiased Prediction的缩写,中文译名是“最佳线性无偏预测”,是当今世界上动物育种值估计中应用相当广泛的先进的统计方法。它是由美国著名数量遗传学家C.R.HENDERSON于20世纪50年代提出的一个非常灵活的线性模型分析方法,它具有广泛的适应性,适宜解决动物育种中各种情况的育种值估计。特别是在群体规模很大、群体结构复杂、获得的数据十分不平衡的情况下,可以获得比传统的育种值估计方法更为准确的估计育种值。因此,可望获得较快的遗传进展。BLUP法的主要优点是:

(1)充分利用个体及其父母、同胞、后代等所有信息,提高了育种值估计的准确性;(2)可消除环境因素造成的偏差,获得个体真实的育种值;(3)能校正由于选配所造成的偏差,例如优良公猪配质量不同的母猪;(4)能考虑不同群体、不同世代的遗传差异;(5)当利用个体的多次记录时,可将由于淘汰所造成的偏差降到最低。例如繁殖母猪淘汰的胎次不同。

上述优点,决定了BLUP法对家畜育种值估计的优越性。研究表明,利用BLUP法对低遗传力性状和限性性状进行选择,可以获得较大的选择反应,远远优于其他方法。例如猪的繁殖性状,用BLUP法选择产仔数这一种遗传力的性状,与个体表型选择相比,遗传进展可提高33%,而对于高遗传力的性状如背膘厚度则可提高12%。

同时还需要指出,BLUP法仅是一种特殊的统计分析方法,此方法是否能完全体现它的优越性,关键要以一定的育种措施,如合理的选种选配、科学的性能测定、完整的记录系统、人工授精系统、数据处理系统等多项育种工作为基础,以先进的计算设备为手段,以优秀的计算软件为工具,以严密的育种组织为保证。

最佳线性无偏预测(Best Linear Unbiased Prediction,简称BLUP)可以对多环境数据进行整合,去除环境效应,得到个体稳定遗传的表型。BLUP是表型处理的常用做法。R包lme4中lmer函数是BLUP分析常用的方法,在很多 NG文章 都引用了该方法。

下面将用实际数据演示多环境无重复数据和多环境有重复数据的过程。首先安装lme4包。

数据格式如下,数据是每个环境叠加的。 有人喜欢用数字表示系名或环境,这样应该把lines和env转换为因子。缺失值用NA表示。

接下我们用lmer进行BLUP分析,在lmer中 1|env 表示把env当作随机效应,我们把env和lines当作随机效应。

我们可以得到遗传方差(即lines的方差) 和残差方差 。遗传力 . 是遗传方差, 是残差方差, 是环境个数。

我们用ranef函数获取随机效应值,blups返回一个list,包含env和lines的随机效应值即BLUP。 blp@beta 为整体均值。

数据格式也是叠加的,多了一列rep表示重复。

多环境有重复的分析中,重复rep是嵌套在环境里, rep%in%env 表示嵌套。有重复的数据还可以分析基因型和环境的互作效应。

遗传力公式为 。 为基因与环境互作方差, 一个环境的重复数, 为环境个数。