为什么随机效果缩小为0？

10

在一般的线性混合模型中，是否有直觉上的理由使随机效应收缩到其预期值？

mixed-model random-effects-model

— 用户名
source

您能否为这个问题提供更多背景信息？

— 2012年

随机效应模型的预测值是收缩估计量；当统计单位不同，测量准确或样本量大时，几乎不会出现缩水现象。这是您所追求的，还是真的意味着朝着期望值的方向收缩？

— chl 2012年

3

我建议Bradley Efron和Carl Morris撰写的较旧的文章，斯坦因的《统计悖论》（1977）（在线PDF在这里）。不确定它是否直观，但这是对收缩概念的非常温和的介绍（带有实际示例）。

— Andy W

4

一般而言，大多数“随机效应”发生在还存在“固定效应”或模型的其他部分的情况下。一般的线性混合模型如下所示：

ÿ_{一世} = X_{一世}^{Ť} β + ž_{一世}^{Ť} ü + ϵ_{一世}

$y_i=x_i^T\beta+z_i^Tu+\epsilon_i$

哪里 $\beta$ 是“固定效应”，而是“随机效应”。显然，区别只能在概念上，或者在和的估计方法上。我若定义一个新的“固定效应” 和然后我有一个普通的线性回归： $u$ $u$ $\beta$ $\tilde{x}_i=(x_i^T,z_i^T)^T$ $\tilde{\beta}=(\beta^T,u^T)^T$

ÿ_{一世} = {\overset{〜}{X}}_{一世}^{Ť} \overset{〜}{β} + ϵ_{一世}

$y_i=\tilde{x}_i^T\tilde{\beta}+\epsilon_i$

在基本概念目标不清楚的情况下进行混合模型拟合时，这通常是一个实际的实际问题。我认为随机效应的事实都向零收缩，而固定效应都没有在这里提供一些帮助。这意味着当的估计值在OLS公式中的精度较低时，我们倾向于偏爱仅包含（即）的模型，而当估计的精度较高时，我们倾向于偏向于完整的OLS公式。 $u$ $\beta$ $\beta$ $u=0$ $u$ $u$

— 概率逻辑
source

2

您的问题不回答自己吗？如果期望一个值，那么将值更接近该值的技术将是最好的。

一个简单的答案来自大量定律。假设对象是您的随机效果。如果您在200个试验中对受试者A到D进行了试验，而在20个试验中对受试者E进行了试验，您认为该受试者的平均表现中哪个更能代表mu？大量定律将预测，与A到D中的任何一个相比，主题E的表现与mu的偏离可能性更大。有理由将对象E的效果缩小到对象A到D的方向，而不是相反。因此，较大且N较小的随机效应往往是收缩最严重的效应。

从此描述中还可以得出为什么固定效果不缩小的原因。因为它们是固定的，所以模型中只有一个。您没有参考将其缩小。您可以使用0的斜率作为参考，但这并不是随机效果趋于缩小的原因。他们倾向于亩的总体估计。您从模型获得的固定效果就是该估计值。

— 约翰
source

1

我认为将混合模型视为分层或多级模型可能对您的直觉有所帮助。至少对我来说，当我想到嵌套以及模型如何以分层方式在类别内和跨类别工作时，这才有意义。

编辑：宏，我已经留下了一些开放性，因为它确实可以帮助我更直观地查看它，但是我不确定它是正确的。但是要向可能错误的方向扩展...

我将其视为固定效果在各个类别之间平均，而随机效应则在各个类别之间进行区分。从某种意义上说，随机效应是具有某些特征的“集群”，并且更大，更紧凑的集群将对较高级别的平均值产生更大的影响。

通过OLS进行拟合（我相信，分阶段进行），更大，更紧凑的随机效果“集群”将更强地向自身拉动拟合，而更小或更分散的“集群”将使拟合拉得更少。或者，由于较高级别的平均值更接近于起点，所以拟合开始接近于更大且更紧凑的“簇”

抱歉，我不清楚，甚至可能是错误的。从直觉上来说，这对我来说很有意义，但是当我尝试编写它时，我不确定它是自上而下还是自下而上，还是其他不同。是较低级别的“集群”更强地适合自己，还是对较高级别的平均值产生较大影响（从而“结束”）较高级别平均值的问题？或者都不是？

无论哪种情况，我都认为这可以解释为什么较小，分散程度更大的随机变量类别比较大，更紧凑的类别更接近均值。

— 韦恩
source

嗨，韦恩，您能否在此基础上进行扩展，以描述如何将收缩视为分层模型来概念化（也许更直观）？

— 2012年

@Macro：好的，我尝试了一下。不过，不确定是否使答案更好或更糟。

— 韦恩