比较具有相同自由度数的混合效果模型


15

我有一个实验,将在这里尝试进行抽象。想象一下,我在您面前扔了三块白色的石头,请您对它们的位置做出判断。我记录了宝石的各种特性以及您的反应。我在许多主题上都这样做。我生成两个模型。一个是离您最近的石头可以预测您的反应,另一个是石头的几何中心可以预测您的反应。因此,在RI中使用lmer可以编写。

mNear   <- lmer(resp ~ nearest + (1|subject), REML = FALSE)
mCenter <- lmer(resp ~ center  + (1|subject), REML = FALSE)

更新和更改-更直接的版本,其中包含一些有用的注释

我可以尝试

anova(mNear, mCenter)

当然,这是不正确的,因为它们不是嵌套的,而且我不能真的那样比较它们。我期望anova.mer引发错误,但没有。但是我可以在这里尝试的嵌套并不是自然的,而且仍然使我缺乏分析性的陈述。当模型自然嵌套(例如线性二次)时,测试只是一种方法。但是在这种情况下,发现不对称意味着什么?

例如,我可以建立一个模型三:

mBoth <- lmer(resp ~ center + nearest + (1|subject), REML = FALSE)

然后,我可以进行方差分析。

anova(mCenter, mBoth)
anova(mNearest, mBoth)

这样做很公平,现在我发现该中心增加了最近的效果(第二个命令),但当将最近的一个中心添加到中心时,BIC实际上上升了(简化了简约性)。这证实了所怀疑的。

但是找到足够了吗?当中心和最近位置高度相关时,这公平吗?

当不是要添加和减去解释变量(自由度)时,是否有更好的方法来分析比较模型?


您的模型不是嵌套的,在两者之间使用LRT的原理是什么?
chl 2010年

根据您的评论重述了内容
约翰·

Answers:


9

仍然,您可以计算固定效果的置信区间,并报告AIC或BIC(请参阅例如Cnann等人,Stat Med 1997 16:2349)。

现在,您可能有兴趣看一看Wagenmakers等人的使用参数化引导程序评估模型模仿。这似乎更像您最初关于评估两个竞争模型的质量的问题。

否则,我想到的关于LMM中解释方差度量的两篇论文是:

  • Lloyd J.Edwards,Keith E.Muller,Russell D.Wolfinger,Bahjat F.Qaqish和Oliver Schabenberger(2008)。一个R2统计量在线性混合模型固定效应统计在医学,27(29),6137-6157。
  • 徐荣辉(2003)。测量线性混合效应模型中的解释变异,《医学统计》,22(22),3527–3541。

但是也许还有更好的选择。


11

遵循ronaf的建议,导致Vuong在非嵌套模型上进行似然比检验的最新论文。它基于KLIC(Kullback-Leibler信息准则),该准则与AIC相似,因为它可以最大程度地缩短KL距离。但是它为该假设建立了概率规范,因此LRT的使用导致了更原则上的比较。Clarke等人提出了Cox和Vuong测试的更易于访问的版本。特别是请参见图3,图3给出了计算Vuong LRT测试的算法。

似乎在其他模型中有Vuong测试的R实现,但没有lmer。尽管如此,上面提到的大纲应该足以实施一个大纲。我认为您无法根据计算所需从lmer获得在每个数据点评估的可能性。在有关sig-ME的注释中,道格拉斯·贝茨(Douglas Bates)提供了一些可能有用的指针(特别是他提到的小插图)。


较旧

另一个选择是在测试预测准确性时考虑模型的拟合值。Williams-Kloot统计数据在这里可能适用。基本方法是根据两个模型的拟合值的线性组合回归实际值,并测试斜率:

第一篇论文描述了测试(和其他),而第二篇论文将其应用在计量经济面板模型中。


使用lmer和比较AIC时,该功能的默认设置是使用REML方法(受限最大可能性)。这对于获得较少偏差的估计值是很好的,但是在比较模型时,应该REML=FALSE使用最大似然法进行拟合以重新拟合。将皮涅罗/贝茨书中提到了一些条件下,它的确定比较AIC /似然无论是REML或ML,而这些可能会在你的情况非常好适用。但是,一般的建议是简单地重新安装。例如,请参见Douglas Bates的文章:


我没有指定我适合REML = FALSE。不过,我还是有点杂念……AIC可以衡量包括随机效应在内的整体可能性。这是一个很大的组成部分。当然,AIC极不可能完全相同。因此,仅选择较大的值而不用某种分析方法来判断该值有多大似乎是不明智的。
约翰

@John在本讲座中,j.mp / bhUVNt重点介绍了关于REML与ML和AIC的有趣观点(并指出了约翰所说的话)。Bolker对GLMM的评论也值得一看:j.mp/cAepqA
chl 2010年

4

drcox有一篇论文讨论了测试单独的[未嵌套]模型。它考虑了一些示例,但并没有增加混合模型的复杂性。[由于我使用R代码的设施有限,所以我不确定您的型号是什么。]

altho cox的论文可能无法直接解决您的问题,可能有两种可能的帮助。

  1. 您可以在Google学术搜索中搜索对其论文的引用,以查看随后的此类结果是否更接近您想要的结果。

  2. 如果您有分析倾向,则可以尝试将cox方法应用于您的问题。[也许不适合胆小的人。]

顺便说一句,cox确实提到了将两个模型组合成一个更大模型的想法。他没有追求如何确定哪种模型更好,但是他指出,即使这两种模型都不是很好,组合模型也可能对数据足够适合。[在您的情况下,尚不清楚组合模型是否有意义。]


3

我不太了解R来解析您的代码,但这是一个主意:

估计一个模型,其中中心和附近都作为协变量(称为mBoth)。然后,将mCenter和mNear嵌套在mBoth中,您可以使用mBoth作为基准来比较mCenter和mNear的相对性能。


1
我当时认为这不合适,因为两者实际上是高度相关的。由于中心距离较远,因此附近也趋向于较远。
约翰2010年

@John好点。

我认为您的观点也很好...我实际上不确定这很重要。我知道它很高,但低于0.8 ...仍然可以分析。
约翰2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.