当处理复杂的最大混合模型时(估计给定数据和模型的所有可能随机效应)是完美的(+1或-1)或在某些随机效应之间几乎完美的相关性,这种情况并不罕见。为了讨论的目的,让我们观察以下模型和模型摘要
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
这些完美相关背后的假定原因是,我们创建了一个模型,该模型对于我们拥有的数据而言太复杂了。在这些情况下给出的常见建议是(例如Matuschek等人,2017;论文)将过参数化系数固定为0,因为这种退化模型往往会降低功率。如果我们在简化模型中观察到固定效果的显着变化,我们应该接受那个。如果没有变化,那么接受原始的就没有问题。
但是,我们假设我们不仅对RE受控的固定效果(随机效果)感兴趣,而且对RE结构也不感兴趣。在给定的情况下,从理论上讲,假设Intercept
和斜率X
具有非零的负相关性是合理的。以下是几个问题:
在这种情况下该怎么办?我们是否应该报告完美的相关性,并说我们的数据不足以估计“真实”相关性?还是应该报告0相关模型?还是我们应该尝试将其他相关性设置为0,以希望“重要”的相关性不再完美?我认为这里没有100%正确的答案,我主要希望听听您的意见。
如何编写将2种特定随机效应的相关性固定为0而又不影响其他参数之间的相关性的代码?
blme
,MCMCglmm
,rstanarm
,brms
...)