一目了然的R结构G结构是什么?


16

我最近一直在使用MCMCglmm包裹。我对文档中称为R结构和G结构的内容感到困惑。这些似乎与随机效应有关-特别是为它们的先验分布指定参数,但是文档中的讨论似乎假设读者知道这些术语是什么。例如:

具有3个可能元素的先验规范的可选列表:R(R结构)G(G结构)和B(固定效应).............方差结构(R和G)的先验)列出了具有逆Wishart的期望(协方差)(V)和置信度参数(nu)的列表

...取自 这里取得

编辑:请注意,我已经按照斯蒂芬的评论改写了其余的问题。

任何人都可以阐明什么R-结构和G-结构是光,在其中线性预测器是一个简单的方差分量模型的上下文中

β0+e0ij+u0j
e0ijN(0,σ0e2)u0jN(0,σ0u2)

我用随附的一些数据制作了以下示例 MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

因此,基于从斯特凡我的意见认为摹结构是。但评论也说,将R结构是σ 2 0 Ë然而,这似乎并没有出现在输出。σ0u2σ0e2lme4

请注意,来自的结果lme4/glmer()与MCMC的两个示例都一致MCMCglmm

所以,是用于R结构和为什么没有这出现在输出为?σ0e2lme4/glmer()


1
使用SAS术语(但可能是更常用的术语),G矩阵是随机效应的方差矩阵,R矩阵是“错误项”的方差矩阵(在您的情况下,它可能是估计的残差方差)?σ0e2
斯特凡劳伦

@StéphaneLaurent谢谢。我怀疑,这可能估计但是当我第一次了解了广义线性模型,我记得σ 2 0 Ë没有估计-只有“越轨”的计算(与)。也许我缺少什么?σ0e2σ0e2lme4
乔·金

1
也许剩余方差的意义上是不明确的时候分配家庭不是高斯一个
斯特凡洛朗

1
@StéphaneLaurent是的!请在一分钟前查看我对Michael的回答的评论-对于二进制结果,应该将其修复(与我在OP中的模型一样)
Joe King

1
当您拥有ME /多级模型时,会有一些差异。想象最简单的情况:。有方差在截距b ,并在误差项ε ģ通常用于的随机效应的VAR-柯阀矩阵(在此情况下一个标量,σ 2 b)&ř 是用于将残余方差的VAR-柯阀矩阵ε Yi=β0+β1X+bi+εibiεiGσb2Riεi在考虑了固定和集群的随机效应之后。它通常被看作是一个对角矩阵的。同样,两个距离都被认为是多元正态w / mean = 0。σ2
gung-恢复莫妮卡

Answers:


8

我希望在下面发表我的评论作为评论,但这还不够。这些是问题而不是答案(与@gung相似,我对该主题的理解不够强烈)。

我的印象是MCMCglmm没有实现“真正的”贝叶斯glmm。真正的贝叶斯模型在本文的第二部分中进行了描述。类似于频率论模型中,一个具有并且对色散参数所需的现有φ 1除了固定参数β和的所述“G”方差随机效应üg(E(yu))=Xβ+Zuϕ1βu

但根据本MCMCglmm晕影,在MCMCglmm实现的模型由下式给出 ,和它不涉及色散参数φ 1。它不同于经典的常客主义模型。g(E(yu,e))=Xβ+Zu+eϕ1

因此,我将并不感到惊讶,不存在模拟与glmer。σe

请为这些粗略的评论道歉,我只是对此进行了快速浏览。


谢谢。因为我觉得很难,所以这个话题应该很难吗?我想我现在对R和G结构的含义感到满意。我仍然困惑的是,缺乏有和我对你的评论说,很好奇是不是真正的贝叶斯。老实说,我无法理解您所链接的所有文章,而且我还在为小插图的某些部分苦苦挣扎,但仅从示例的角度来看,我相信色散参数ϕ 1应该是恒定的(因为例如二项式)。我想念什么?σeglmerMCMCglmmMCMCglmmϕ1
Joe King

抱歉,我的话不完全正确。MCMCglmm确实是贝叶斯算法,但它不能完全实现经典的glmm(我认为)。此外,您还必须注意,很难设置先验值以对接近频繁推断的方差分量进行推断。
斯特凡·洛朗

再次感谢。在我的研究中,我发现我可以在MCMCglmm使用各种参数时对方差分量使用​​默认的反wishart分布,并且95%可信区间始终包含方差值用于估计随机效应,glmer因此我觉得这是合理的,但是如果MCMCglmm间隔对优先级的选择不是很敏感的结果,我应该如何解释这种情况(可能不是典型的情况)?也许我应该问一个新的问题?
乔·金

也许您的样本量很大?以下是有关您最初的问题,我的印象是,至少在二项式情况下,glmer模型相当于与MCMCglmm模型下。如果设置上之前会发生什么σ é高度集中在0σe=0σe0
斯蒂芬·洛朗

是的,我有一个相当大的样本量:225个聚类中有50,000个观察值(我自己的数据,而不是问题中的示例)。当我设置非常集中在靠近上零的现有,通过设置V = 0.01和NU = 100然后我得到0.25(CI:0.16,0.29)为σ È和0.53(0.38,0.73)为σ ü。当我设置一个信息较少的先验时,V = 10和nu = 0.01时,我分别获得0.18(0.12,0.23)和0.49(0.34,0.63)。与此相比,来自的0.51 。我什至尝试了一个不合适的单位,给出了0.10(0.08,0.13)和0.47(0.25,0.68)。σeσeσuglmer
乔·金

11

Rσe21

GG

最后一点,由于残差未固定为零,因此估算值将与中的估算值不匹配glmer。您需要重新缩放它们。这是一个小例子(不使用随机效果,但可以概括)。请注意R结构的方差如何固定为1。

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

这是二项式族的缩放比例常数:

k <- ((16*sqrt(3))/(15*pi))^2

现在将其除以解,得到后验模式

posterior.mode(m2$Sol/(sqrt(1 + k)))

哪个应该与我们从中得到的相当接近 glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

您会碰巧知道如何在MCMCglmm的一级指定异方差吗?那是R结构吗?那么语法是什么?
Maxim.K 2014年

@Joshua,您能解释一下“二项式家庭的缩放常数”吗?PS:对于种子123,我从(和校正后)得到m2-8.1640.421;和从glm-8.8330.430
Qaswed

重标常数可以在Diggle等人的文章中找到。等 (amazon.de/Analysis-Longitudinal-Oxford-Statistical-Science/dp/...) -根据cran.r-project.org/web/packages/MCMCglmm/vignettes/...当量 2.14第47页
Qaswed
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.