在混合模型中将因素视为随机因素有什么好处?


24

我出于某些原因而无法接受将模型因子标记为随机变量的好处。在我看来,似乎在几乎所有情况下,最佳解决方案都是将所有因素视为固定的。

首先,固定与随机的区别是任意的。标准解释是,如果一个人对特定的实验单位本身感兴趣,则应使用固定效应,而如果一个人对实验单位所代表的种群感兴趣,则应使用随机效应。这没有太大帮助,因为这意味着即使数据和实验设计保持相同,也可以在固定视图和随机视图之间进行切换。同样,此定义引起一种错觉,即如果将因子标记为随机,则从模型得出的推论比将因子标记为固定的情况更适用于总体。最后,盖尔曼(Gelman)表明,固定随机的区别令人困惑 甚至在定义级别,因为还有四个关于固定效应和随机效应的定义。

其次,混合模型的估计非常复杂。与“纯固定”模型相反,有多种方法可以获取p值,在R的lme4程序包中实现REML估计的贝茨教授甚至拒绝完全报告p值。 。

第三,存在一个模糊的问题,即随机因素会引入多少个隐式参数。以下示例是我对Burnham&Anderson,“ 模型选择”和“多模型推理:一种实用的信息理论方法”的改编。从偏差方差折衷的角度来看,随机效应的作用可以说明如下。考虑采用处理和主因子效应的单向方差分析,其中是可估计的。错误项具有分布。如果观察次数固定,则随着的增加,偏差方差折衷将恶化。假设我们说ķ ķ - 1 Ñ0 σ 2ķ ķKKK1N(0,σ2)KK主要效果来自分布。相应的模型将具有介于固定(过度拟合)版本和仅包含截距的欠拟合模型之间的复杂性。固定模型中有效参数的数量为N(0,σK)

1intercept+(K1)maineffects+1σ=K+1.

随机模型中有效参数的数量至少为三个:。另外,随机模型具有许多“隐藏”参数,这些参数是对主要效果施加的分布(在这种情况下为正常)限制所隐含的。intercept,σ,σK

尤其是,如果存在一个具有两个水平的因子,则将其称为随机是没有意义的,即使我们确定知道它的水平是从某些人群中随机抽样的也是如此。这是因为固定效果版本具有三个参数,而随机效果版本具有三个以上参数。在这种情况下,随机模型比固定版本具有更高的复杂性。显然,从固定版本到随机版本的切换更适合更大的K。但是,随机模型中“隐藏”参数的数量是未知的,因此无法根据信息标准(例如AIC)比较固定版本和随机版本。因此,尽管该示例阐明了随机效应的贡献(更好的偏差-方差权衡的可能性),但它也表明,很难说何时可以合理地将因子从固定重新标记为随机。

“完全固定”模型中没有上述问题。因此,我愿意问:

  1. 谁能提供一个示例,说明在使用随机因子(如固定因子)时发生了非常糟糕的事情吗?我认为应该进行一些模拟研究来明确解决该问题。

  2. 是否有行之有效的定量方法来决定何时从固定标签转换为随机标签?


写得很好的问题,我从阅读中学到了一些东西。我确实想知道,从长远来看,随机效应分析是否注定要失败,也许会被更直接的平滑技术所击败。如果我确实想回答#1,我会遇到一种情况,即变异性高,主题众多,主题内样本量较小。然后,主题内的固定估算值将遍布各地。
Ben Ogorek 2014年

Answers:


20

1.赫伯·克拉克(Herb Clark)(1973;紧随科尔曼(Coleman),1964年)描述了心理学和语言学的一个著名例子:“语言作为固定效应的谬论:对心理学研究中语言统计的批评。”

克拉克(Clark)是一位心理学家,讨论心理实验,其中一些研究对象对一组刺激材料做出反应,这些刺激材料通常是从某些语料库中提取的各种单词。他指出,在这些情况下使用的基于重复测量方差分析的标准统计程序(被克拉克称为)将参与者视为随机因素,但(可能会隐含地)将刺激材料(或“语言”)视为固定。这导致在解释关于实验条件因子的假设检验的结果时出现问题:自然地,我们想假设一个阳性结果告诉我们有关我们抽取参与者样本的总体以及我们所依据的理论总体的一些信息。语言材料。但是F1F1通过将参与者视为随机参与者并将其固定为刺激,只会告诉我们条件因素对其他完全相同的参与者做出响应的相似参与者的影响。在更恰当地将参与者和刺激都视为随机的情况下进行分析可能会导致类型1的错误率大大超过标称水平(通常为.05),其程度取决于诸如数字的数量和变异性刺激和实验设计。在这些情况下,至少在经典ANOVA框架下,更适当的分析是使用基于均方线性组合比的准统计量。F1αF

克拉克(Clark)的论文当时在心理语言学上引起了轰动,但未能在更广泛的心理学文献中大放异彩。(甚至在心理语言学领域,克拉克的建议多年来也有些扭曲,正如Raaijmakers,Schrijnemakers和Gremmen所记录的那样,(1999年)。)但在最近几年,这个问题有所复苏,这在很大程度上是由于统计的进步在混合效果模型中,经典混合模型ANOVA可以看作是特例。这些近期的论文包括Baayen,Davidson和Bates(2008),Murayama,Sakaki,Yan和Smith(2014),以及(hem)Judd,Westfall和Kenny(2012)。我确定有些事情我会忘记。

2.不完全是。有一些方法可以确定某个因素是否更好地作为随机效应包括在模型中(参见例如Pinheiro&Bates,2000,第83-87页;但是请参见Barr,Levy,Scheepers和Tily, 2013)。当然,还有经典的模型比较技术,用于确定因素是否更好地作为固定效应包括在内(即检验)。但是我认为,确定一个因素是更好地视为固定因素还是随机因素通常最好留给一个概念性问题,要通过考虑研究的设计和从中得出的结论的性质来回答。F

我的一位研究生统计讲师之一,加里·麦克莱兰(Gary McClelland)喜欢说,统计推断的基本问题可能是:“与什么相比?” 继加里之后,我认为我们可以将我上面提到的概念性问题构架为:我想将我的实际观察结果与之比较的假设实验结果的参考类别是什么?停留在心理语言学的语境中,考虑一个实验设计,在该设计中,我们有一个主题样本响应被分类为两个条件之一的单词样本(该特殊设计由Clark,1973年详细讨论)。两种可能性:

  1. 这组实验中,对于每个实验,我们从生成模型中抽取一个新的主题样本,一个新的单词样本以及一个新的错误样本。在此模型下,主题和单词都是随机效应。
  2. 这组实验中,对于每个实验,我们绘制一个新的Subject样本和一个错误的新样本,但我们始终使用相同的Words集合。在此模型下,主题是随机效果,而单词是固定效果。

为了使这一点更加具体,下面是(上)来自模型1下4个模拟实验的4组假设结果的一些图;(下图)来自模型2下4个模拟实验的4组假设结果。每个实验都以两种方式查看结果:(左图)按主题分组,按条件划分主题方法并为每个主题捆绑在一起;(右图)按单词分组,并用方框图概括每个单词的响应分布。所有实验都涉及10个对象,对10个单词做出响应,并且在所有实验中,相关人群中没有条件差异的“零假设”成立。

主题和单词都随机:4个模拟实验

both_random

请注意,在每个实验中,主题和单词的响应配置文件完全不同。对于主题,我们有时会得到较低的总体响应者,有时是较高的响应者,有时会倾向于显示较大的条件差异,有时会倾向于显示较小的条件差异。同样,对于单词,我们有时会得到倾向于引起低响应的单词,有时也会得到倾向于引起高响应的单词。

主题随机,单词固定:4个模拟实验

subs_random

请注意,在这4个模拟实验中,主题每次看起来都不同,但是单词的响应配置文件看起来基本相同,这与我们在此模型下为每个实验重用同一组单词的假设相一致。

我们认为模型1(主题和单词都是随机的)还是模型2(主题是随机,单词固定)的选择为我们实际观察到的实验结果提供了适当的参考类别,可以对我们对条件操纵是否进行评估产生重大影响“工作。” 我们希望模型1下的数据比模型2下的机会变化更多,因为存在更多的“活动部件”。因此,如果我们希望得出的结论与机会可变性相对较高的模型1的假设更加一致,但是我们在机会可变性相对较低的模型2的假设下分析数据,则我们的类型1错误条件差异的测试速率将被夸大到一定程度(可能很大)。有关更多信息,请参见下面的参考。

参考文献

Baayen,RH,Davidson,DJ和Bates,DM(2008)。主题和项目具有交叉随机效应的混合效应建模。记忆与语言杂志,59(4),390-412。PDF格式

Barr,DJ,Levy,R.,Scheepers,C.,&Tily,HJ(2013)。验证性假设检验的随机效应结构:保持最大。记忆与语言杂志,68(3),255-278。PDF格式

克拉克(HH)(1973)。语言固定效应谬论:心理学研究中对语言统计的批评。语言学习与言语行为杂志,12(4),335-359。PDF格式

EB,科尔曼(1964)。推广到语言人群。心理报告,14(1),219-226。

Judd,CM,Westfall,J.,&Kenny,DA(2012)。将刺激视为社会心理学中的一个随机因素:这是一个普遍而又被广泛忽略的问题的新的综合解决方案。人格与社会心理学杂志,103(1),54. PDF

Murayama,K.,Sakaki,M.,Yan,VX,&Smith,GM(2014)。传统的参与者分析中的I型错误通货膨胀对元内存准确性的影响:广义混合效应模型的观点。实验心理学杂志:学习,记忆和认知。PDF格式

Pinheiro,JC和Bates,DM(2000)。S和S-PLUS中的混合效果模型。施普林格。

Raaijmakers,JG,Schrijnemakers,J。和Gremmen,F。(1999)。如何处理“固定不变的语言谬论”:常见的误解和替代解决方案。记忆与语言杂志,41(3),416-426。PDF格式


1
+1这是一个很好的答案,2012年的论文非常好阅读。
变形虫说恢复莫妮卡2014年

由于最初的问题已经与进行出色的讨论相关联,因此您实际上指的是什么?
詹姆斯·

1
Gelman链接
Jake Westfall 2014年

@James我继续添加了一些概念性的东西,包括一些图片。让我知道你的想法。
杰克·韦斯特伦

谢谢你的照片。根据您的最后一段,模型中标记为随机的效果越多,其余固定效果的p值越高。但是,对于加性模型,当在PROC MIXED中使用默认的“包含”方法时,固定效果的p值将相同。这个问题中的一个特定示例:stats.stackexchange.com/q/112640/54099您如何解释?
詹姆斯

1

假设我有一个制造过程,涉及在几台不同的机器上制造材料。它们是我仅有的机器,因此“机器”是固定的。但是我在每台机器上制作了很多材料,并且我对预测未来的产品很感兴趣。我将“手数”作为随机因素,因为我对将来获得的结果感兴趣。


1
亲爱的埃米尔:恐怕您听不懂我问的问题。您的示例说明了我本人在问题中提供的“固定与随机”的最常见定义。无论如何,使用您的示例,您能否告诉我为什么从批号是固定因子的模型中得出关于未来响应的推断是一个坏主意吗?
詹姆斯,

如果您将“批号”视为固定,则推论仅适用于已经测试的批号。在其他情况下,也会发生相同的事情。如果要推断随机效应,则将它们视为固定效应通常会给出错误的答案。在许多混合模型情况下,将随机效应视为固定效应甚至会给出关于实际固定效应的错误答案。
埃米尔·弗里德曼

这不是上升还是下降的问题。如果进行了不适当的分析,则结果通常是不正确的。
埃米尔·弗里德曼

您能否为模拟研究提供参考,以证明根据固定/随机标签结果如何变得不正确?
詹姆斯

还请注意,MLE不是免费提供的,特别是当存在方差分量时。尝试建立包含3个因子和几个连续协变量的交叉因子设计。然后尝试估算纯固定模型和一些混合规格。只要存在导致从OLS切换到MLE / REML的随机分量,收敛,出现零或负方差分量或其他无意义结果的问题就更有可能出现。
2014年

1

因此,您将它们视为随机变量,以便根据因子的样本量和观察的总数,在特定因子的总体平均值和平均值之间产生平均效果。这使您可以说您的结果适用于总体人口,因为您具有加权平均类型,并且可以估算该因素导致的变化,如果没有,您实际上只能说您的结果适用于因素水平之所以使用您的方法,是因为回归将把它们视为离散因子,而不是随机变量,它们会获得加权平均。

当您对同一主题重复测量时,它们也很有用,因为您可以使用它们来说明同一主题上的测量之间的相关性。


至于RM,这就是我首先问这个问题的原因之一。就像我在这里提到的那样:stats.stackexchange.com/q/112640/54099将主题视为固定值或随机值不会更改处理p值,所以为什么要打扰。
詹姆斯

如果您有一个简单的交叉设计,其中一个因子固定且一个随机,并且使用期望均方根,则固定因子的p值将与将两个因子都视为固定因子时的p值不同。
埃米尔·弗里德曼

1

Yij=β1Xij+β2Zi+ei+μijXijZiβ2ZiiZi

Yij=β1Xij+ei+μijZi

β1β1


(原始答案)

基本上需要使用随机效果的一个地方是,当您要包括在固定效果的分组级别不变的参数时。

例如,假设您想调查医生特征(例如/教育)对患者结果的影响。该数据集是具有观察到的患者结果和患者/医生特征的患者级别。由于由一位医生接受治疗的患者可能具有相关性,因此您需要对此进行控制。您可以在此处插入医生固定效果,但是这样做会排除在模型中包括任何医生特征。如果关注医生级别的特征,这是有问题的。


您能提供一些模型陈述吗?
2014年

0

我认为这与估算的一致性有关。

xij=ai+bj+eai

bj

Neyman和Scott(1948)指出了

aibj

aibj

一致的。至少,这就是我的理解...

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.