为什么随机效果缩小为0?


10

在一般的线性混合模型中,是否有直觉上的理由使随机效应收缩到其预期值?


您能否为这个问题提供更多背景信息?
2012年

随机效应模型的预测值是收缩估计量;当统计单位不同,测量准确或样本量大时,几乎不会出现缩水现象。这是您所追求的,还是真的意味着朝着期望值的方向收缩?
chl 2012年

3
我建议Bradley Efron和Carl Morris撰写的较旧的文章,斯坦因的《统计悖论》(1977)(在线PDF在这里)。不确定它是否直观,但这是对收缩概念的非常温和的介绍(带有实际示例)。
Andy W

Answers:


4

一般而言,大多数“随机效应”发生在还存在“固定效应”或模型的其他部分的情况下。一般的线性混合模型如下所示:

ÿ一世=X一世Ťβ+ž一世Ťü+ϵ一世

哪里β是“固定效应”,而是“随机效应”。显然,区别只能在概念上,或者在uβ的估计方法上。我若定义一个新的“固定效应” X = X Ť Ž Ť Ťβ = β ŤÚ Ť Ť然后我有一个普通的线性回归:üüβX一世=X一世Ťž一世ŤŤβ=βŤüŤŤ

ÿ一世=X一世Ťβ+ϵ一世

在基本概念目标不清楚的情况下进行混合模型拟合时,这通常是一个实际的实际问题。我认为随机效应的事实向零收缩,而固定效应β都没有在这里提供一些帮助。这意味着当u的估计值在OLS公式中的精度较低时,我们倾向于偏爱仅包含β(即u = 0)的模型,而当估计的u的精度较高时,我们倾向于偏向于完整的OLS公式。ü β βü=0üü


2

您的问题不回答自己吗?如果期望一个值,那么将值更接近该值的技术将是最好的。

一个简单的答案来自大量定律。假设对象是您的随机效果。如果您在200个试验中对受试者A到D进行了试验,而在20个试验中对受试者E进行了试验,您认为该受试者的平均表现中哪个更能代表mu?大量定律将预测,与A到D中的任何一个相比,主题E的表现与mu的偏离可能性更大。有理由将对象E的效果缩小到对象A到D的方向,而不是相反。因此,较大且N较小的随机效应往往是收缩最严重的效应。

从此描述中还可以得出为什么固定效果不缩小的原因。因为它们是固定的,所以模型中只有一个。您没有参考将其缩小。您可以使用0的斜率作为参考,但这并不是随机效果趋于缩小的原因。他们倾向于亩的总体估计。您从模型获得的固定效果就是该估计值。


1

我认为将混合模型视为分层或多级模型可能对您的直觉有所帮助。至少对我来说,当我想到嵌套以及模型如何以分层方式在类别内和跨类别工作时,这才有意义。

编辑:宏,我已经留下了一些开放性,因为它确实可以帮助我更直观地查看它,但是我不确定它是正确的。但是要向可能错误的方向扩展...

我将其视为固定效果在各个类别之间平均,而随机效应则在各个类别之间进行区分。从某种意义上说,随机效应是具有某些特征的“集群”,并且更大,更紧凑的集群将对较高级别的平均值产生更大的影响。

通过OLS进行拟合(我相信,分阶段进行),更大,更紧凑的随机效果“集群”将更强地向自身拉动拟合,而更小或更分散的“集群”将使拟合拉得更少。或者,由于较高级别的平均值更接近于起点,所以拟合开始接近于更大且更紧凑的“簇”

抱歉,我不清楚,甚至可能是错误的。从直觉上来说,这对我来说很有意义,但是当我尝试编写它时,我不确定它是自上而下还是自下而上,还是其他不同。是较低级别的“集群”更强地适合自己,还是对较高级别的平均值产生较大影响(从而“结束”)较高级别平均值的问题?或者都不是?

无论哪种情况,我都认为这可以解释为什么较小,分散程度更大的随机变量类别比较大,更紧凑的类别更接近均值。


嗨,韦恩,您能否在此基础上进行扩展,以描述如何将收缩视为分层模型来概念化(也许更直观)?
2012年

@Macro:好的,我尝试了一下。不过,不确定是否使答案更好或更糟。
韦恩
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.