何时在模型中包括随机效应


9

我是混合建模的新手,我对在进行分析时是否适合使用随机效应感到困惑。任何意见,将不胜感激。

我的研究正在测试新近开发的哺乳动物丰度指数如何预测已建立但劳动强度更高的指数的价值。我一直在多个森林补丁中测量这些指数,每个森林补丁中都有多个图。

因为我对森林补丁的效果并不直接感兴趣,并且因为我的样地嵌套在森林补丁中,所以我一直将森林补丁用作随机效果。但是,我对此有两个问题:

首先,我知道随机效应使您能够在所有可能水平的随机因子上,而不只是在抽样的水平上,对结果进行概括。但是在我看来,要进行这种推断,您的水平必须随机抽样吗?我的森林斑块不是随机取样的,所以我仍然可以将它们用作随机效果吗?

第二,我读过,您可以通过进行似然比检验来比较具有和没有效应的模型,从而检验是否有必要产生随机效应。我已经做到了,它表明随机效应模型不能解释数据,而只能解释固定效应模型。我的问题是我的地块仍然嵌套在森林斑块中,因此大概不是独立的。因此,我可以使用这种LRT方法来证明排除随机效应的合理性,还是我仍需要包括它来解决嵌套问题?如果我最终消除了随机效应,是否有办法验证森林斑块内的地块是否可以视为独立的?

谢谢你的帮助!

周杰伦


我认为具有随机效应的主要概念是它们都应具有相同的大小并且可以互换-这就是对非采样随机效应进行推断的可能。另外,对于LR随机效应,应谨慎使用,因为即使ML / REML估计为零或接近于零,方差分量仍可能存在很大的不确定性。
概率

对此非常感谢,如果有必要保持随机效果,有什么办法可以解决?
2013年

据我了解,最好不要对REML拟合的模型进行LR比较。例如,在R的lmer中,执行LRT时应设置REML = FALSE。(默认为TRUE,否则会更好。)
Wayne

Answers:


6

据我了解,您有一个简单的嵌套观测设计(补丁内的图形),并且您的兴趣在于两个连续变量(两个索引)之间的相关/回归。您的样本大小为m个补丁xn个图= N对观测值(如果不平衡,则为适当的摘要)。没有涉及适当的随机化,但是您可能/应该/希望考虑(1)从此类或某个区域的所有补丁中“随机”选择了补丁,然后(2)地块是“随机”的在每个补丁中选择。

如果您忽略随机因子补丁,则可以通过考虑“自由”随机选择N个图来进行伪复制,而不必将它们限制为(数量或类型上)那些(先前)选择的补丁。

因此,您的第一个问题是:是的,这是随机因素允许的。此类推论的有效性取决于以下假设的有效性:偶然性选择等同于补丁的随机选择(例如,如果选择了不同的森林补丁集,结果将不会有所不同)。这也限制了您的推理空间:结果延伸到的森林或地理区域的种类取决于样本是可信的“随机”样本的最大(虚数)斑块。也许您的观察结果是您所在地区森林斑块哺乳动物的“合理随机”样本,但可能是整个大陆的哺乳动物的可疑集合样本。

第二个:测试将取决于“伪复制程度”,或样本中标明“属于”补丁的证据。即,补丁之间以及补丁内的图之间有多少变化(搜索类内相关性)。在极端情况下,仅存在补丁程序之间的差异(补丁程序中的所有图都相同),并且您具有“纯伪复制”:您的N应该是补丁程序的数量,并且从每个补丁程序中抽取一个或多个图无法提供新的消息。另一方面,所有变异都发生在地块之间,并且没有额外的变异,因为知道每个地块都属于哪个森林斑块(然后没有随机因素的模型显得更加简约);您有“独立”图。极端情况极不可能发生……特别是对于在地面上观察到的生物变量,即使仅仅是由于哺乳动物的空间自相关和地理分布。我个人更喜欢通过设计保留因素(例如,即使补丁不是此样本中相关的变化源),也可以维持上面解释的“实验观察”类比;请记住:样本中没有证据可以拒绝零假设,即补丁之间的差异为零,并不意味着总体中的差异为零。即使补丁不是此样本中相关的变化来源,也无法维持上述的“实验观察”类比;请记住:样本中没有证据可以拒绝零假设,即补丁之间的变化为零并不意味着总体中的变化为零。即使补丁不是此样本中相关的变化来源,也无法维持上述的“实验观察”类比;请记住:样本中没有证据可以拒绝零假设,即补丁之间的变化为零并不意味着总体中的变化为零。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.