随机斜率混合模型的类内相关系数


10

我为参与者()和项目()m_plot配备了以下lme4::lmer带有交叉随机效应的模型:lfdncontent

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

我想知道参与者和项目的类内相关系数(ICC)。有了这个好答案,我原则上知道如何为我的模型获取ICC。但是,我不确定是否要包括随机斜率:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

同一参与者分别对同一项目的两次答复之间的相关性的适当度量是什么?


1
Merlo等人,“ 2005年关于社会流行病学多层次分析的简要概念教程:调查不同人群的背景现象”可能是有用的参考。
N Brouwer 2014年

@Henrik您是否找到这个问题的答案?我也很感兴趣
帕特里克S. Forscher

2
@ PatrickS.Forscher据我了解,ICC对于随机斜率没有意义。我从杰克·韦斯特尔弗里(Jake Westfall)学到了这一点。
亨里克

偶然获得了与阅读相关的阅读的链接?
Patrick S. Forscher '12

1
@ PatrickS.Forscher如您所见,Jake Westfall现在提供了一个很好的答案。
亨里克

Answers:


8

基本上没有单个数字或估计值可以概括随机斜率模型中的聚类程度。

类内相关性(ICC)只能写成纯随机拦截模型中方差的简单比例。要了解原因,可以在这里找到ICC表达式的派生草图。

当您将随机斜率投入模型方程式时,遵循相同的步骤将导致本文第5页上的ICC表达式。如您所见,复杂的表达式是预测变量X的函数。要更直观地了解为什么当存在随机斜率时var(Y)取决于X,请查看这些幻灯片的第30页(“为什么方差取决于x ?”)

由于ICC是预测变量(x值)的函数,因此只能针对特定的x值集进行计算。您也许可以尝试类似以x值的联合平均值报告ICC的方法,但是对于大多数观察结果而言,该估计值显然是不准确的。

我所说的一切仍然仅是指只有一个随机因素的情况。由于存在多个随机因素,它变得更加复杂。例如,在一个多站点项目中,每个站点的参与者对刺激样本(即3个随机因素:站点,参与者,刺激)做出响应,我们可以询问许多不同的ICC:两个响应之间的预期相关性是什么?来自不同参与者的同一地点,同一刺激?在不同的地点,相同的刺激因素和不同的参与者情况如何?等等。@rvl在OP链接的答案中提到了这些并发症。

正如您所看到的,我们可以用单个值总结聚类程度的唯一情况是单随机因子仅随机截获情况。因为这只是现实案例中的一小部分,所以ICC在大多数情况下并没有那么有用。因此,我的一般建议是不要担心它们。相反,我建议仅报告方差分量(最好以标准差形式)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.