混合线性模型中BLUE值 VS BLUP值

混合线性模型中BLUE值 VS BLUP值

混合线性模型中BLUE值 VS BLUP值

最佳线性无偏预测(best linear unbiased prediction, 简称BLUP),又音译为“布拉普”[1],是统计学上用于线性混合模型对随机效应进行预测的一种方法。最佳线性无偏预测由C.R. Henderson提出。随机效应的最佳线性无偏预测(BLUP)等同于固定效应的最佳线性无偏估计(best linear unbiased estimates, BLUE)(参见高斯-马尔可夫定理)。因为对固定效应使用估计一词,而对随机效应使用预测,这两个术语基本是等同的。BLUP被大量使用于动物育种。——wiki

BLUP值,相当于是对混合线性模型中随机因子的预测;

BLUE值,相当于是对混合线性模型中固定因子的估算

predict means:预测均值,固定因子和随机因子都可以预测均值,它的尺度和表型值尺度一致


将处理作为固定因子


将处理作为固定因子
setwd("D:\\02 ASReml\\blue VS blup")
library(asreml)
library(tidyverse)
dat <- read.csv("MaizeRILs.csv",head=T)
for (i in 1:4) dat[,i] <- as.factor(dat[,i])
as1 <- asreml(height ~ location/rep + location*RIL,data=dat)
ASReml: Tue May 08 11:07:55 2018

     LogLik         S2      DF      wall     cpu
   -723.8797     64.8862   244  11:07:55     0.1
   -723.8797     64.8862   244  11:07:55     0.0

Finished on: Tue May 08 11:07:55 2018

LogLikelihood Converged 
#计算品种的BLUE值
ablue <- coef(as1)$fixed
blue1 <- ablue[grep("^RIL_RIL*",rownames(ablue)),] %>% as.data.frame()
head(blue1)
#计算品种的预测均值(predict means)
pv1 <- predict(as1,"RIL")$predictions$pvals
ASReml: Tue May 08 11:13:33 2018

     LogLik         S2      DF      wall     cpu
   -723.8797     64.8862   244  11:13:33     0.0
   -723.8797     64.8862   244  11:13:33     0.0

Finished on: Tue May 08 11:13:33 2018

LogLikelihood Converged 
head(pv1) # 类似SAS中的lsmeans
#运行模型:因素作为随机因子
as2 <- asreml(height ~ 1,random = ~location/rep + location*RIL,data=dat)
ASReml: Tue May 08 11:13:34 2018

     LogLik         S2      DF      wall     cpu
  -1646.5302    233.5135   495  11:13:34     0.0
  -1569.0397    137.9186   495  11:13:34     0.0
  -1507.3257     94.6888   495  11:13:34     0.0
  -1471.3354     74.5149   495  11:13:34     0.0
  -1462.9209     67.6142   495  11:13:34     0.0
  -1461.7649     65.3553   495  11:13:34     0.0
  -1461.7228     64.9069   495  11:13:34     0.0
  -1461.7228     64.8863   495  11:13:34     0.0
  -1461.7228     64.8862   495  11:13:34     0.0

Finished on: Tue May 08 11:13:34 2018

LogLikelihood Converged 
blup <- coef(as2)$random
blup2 <- blup[grep("^RIL_RIL-*",rownames(blup)),] %>% as.data.frame()
head(blup2)
#预测均值
pv2 <- predict(as2,"RIL")$predictions$pvals
ASReml: Tue May 08 11:13:34 2018

     LogLik         S2      DF      wall     cpu
  -1461.7228     64.8862   495  11:13:34     0.0
  -1461.7228     64.8862   495  11:13:34     0.0
  -1461.7228     64.8862   495  11:13:34     0.0
  -1461.7228     64.8862   495  11:13:34     0.0

Finished on: Tue May 08 11:13:34 2018

LogLikelihood Converged 
head(pv2)
#计算遗传力
summary(as2)$varcomp
str(dat)
'data.frame':    496 obs. of  9 variables:
 $ location: Factor w/ 4 levels "ARC","CLY","PPAC",..: 1 1 2 2 3 3 4 4 1 1 ...
 $ rep     : Factor w/ 2 levels "1","2": 1 2 1 2 1 2 1 2 1 2 ...
 $ block   : Factor w/ 8 levels "1","2","3","4",..: 4 6 5 4 8 5 1 4 1 2 ...
 $ plot    : Factor w/ 122 levels "1","2","3","4",..: 28 47 36 92 64 40 7 27 6 9 ...
 $ RIL     : Factor w/ 62 levels "RIL-1","RIL-11",..: 1 1 1 1 1 1 1 1 2 2 ...
 $ pollen  : int  73 74 71 73 97 95 72 72 69 69 ...
 $ silking : int  77 79 74 77 101 100 78 78 71 72 ...
 $ ASI     : int  4 5 3 4 4 5 6 6 2 3 ...
 $ height  : num  182 169 213 203 156 ...
VSNR::pin(as2,h2 ~ V3/(V3 + V4/4 + V5/(2*4)))


将数据保存到excel中
library(openxlsx)
write.xlsx(blue1,"blue.xlsx")
write.xlsx(blup2,"blup.xlsx")
write.xlsx(pv1,"pm1.xlsx")
write.xlsx(pv2,"pm2.xlsx")
结果解析


RIL是基因型

pm2-random是RIL作为随机因子的预测均值

pm1-fixed是RIL作为固定因子时的预测均值

blue是RIL作为固定因子的BLUE值

blup是RIL作为随机因子的BLUP值

pm2-blup 是随机因子的预测均值 减去 随机因子的BLUP值,可以看到得到的是一个常数(均值)

pm1-mu-random 是固定因子的预测均值 减去 固定依着你的BLUE值, 可以看到不是一个常数

blup/blue_effect=heritibility 是BLUP值 除以 BLUE效应值,得到的是遗传力常数

备注:blue_effect是用固定因子的预测均值 减去 整体均值

GWAS关联分析课程推荐:https://bdtcd.xetslk.com/s/2KgXQq

  • 发表于 2021-11-04 17:41
  • 阅读 ( 3313 )
  • 分类:GWAS

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

700 篇文章

作家榜 »

  1. omicsgene 700 文章
  2. 安生水 348 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章