边际模型与随机效应模型–如何在它们之间进行选择?给外行的建议


11

在搜索有关边际模型随机效应模型以及如何在它们之间进行选择的任何信息时,我发现了一些信息,但是它或多或少是数学抽象的解释(例如此处的示例:https://stats.stackexchange .com / a / 68753/38080)。我发现在这两种方法/模型之间的参数估计值之间存在实质性差异(http://www.biomedcentral.com/1471-2288/2/15/),但是Zuur等人则相反。(2009年,第116页;http://link.springer.com/book/10.1007%2F978-0-387-87458-6)。边际模型(广义估计方程法)带来了总体平均参数,而随机效应模型(广义线性混合模型)的输出考虑了随机效应–主体(Verbeke等人,2010年,第49-52页;http:/ /link.springer.com/chapter/10.1007/0-387-28980-1_16)。

我想在非统计学家和非数学家熟悉的语言中,在一些模型(现实生活)示例中看到对这些模型的一些类似外行的解释。

详细来说,我想知道:

什么时候应该使用边际模型,什么时候应该使用随机效应模型?这些模型适合哪些科学问题?

这些模型的输出应如何解释?

Answers:


14

感谢您链接我的答案!我将尝试给出明确的解释。这个问题已经在该站点上讨论了很多次(请参见右侧的相关问题),但是对于“外行人”来说,这确实令人困惑并且很重要。

首先,对于线性模型(连续响应),边际模型和条件模型(随机效应)的估计值是一致的。因此,我将专注于非线性模型,尤其是二进制数据的逻辑回归。

科学问题

区分边际模型和条件模型的最常用示例是:

如果您是医生,并且想要估计他汀类药物会降低患者心脏病发作几率的可能性,则特定受试者的系数是明智的选择。另一方面,如果您是州卫生官员,并且您想知道如果高危人群中的每个人都服用染色剂,那么死于心脏病发作的人数将会如何变化,您可能希望使用该人群–平均系数。(艾莉森,2009年)

这两种科学问题对应于这两个模型。

插图

如果我们将协变量从“他汀类药物”更改为“时间”,那么到目前为止,我所看到的最好的例证是“ 应用纵向分析”中的下图(Fitzmaurice,Laird和Ware,2011年,第479页)。显然,这两个模型的系数范围不同,这可以通过以下事实来基本解释:随机变量的非线性函数的均值与均值的非线性函数不相等。

在此处输入图片说明

解释

在上图中,虚线来自随机拦截模型。它表明,在解释固定效应时,我们需要控制随机效应常数,即在解释斜率时仅沿着一条线。这就是为什么我们称随机效应模型的估计为“特定于对象”的原因。特别,

  • 对于条件模型,其解释是,给定主题的对数几率会随着时间的单位变化而变化吗?(请参阅Fitzmaurice,Laird和Ware(2011)的第403页,讨论有关为什么条件模型中的时不变协变量的解释可能会产生误导的讨论。)
  • 对于边际模型,其解释与线性回归的解释完全相同,即,对数几率随时间单位变化或药物与安慰剂的对数几率之比如何变化。

此站点上还有另一个示例


非常感谢您的答复!我还有一个问题:您曾写道,边际效应模型和随机效应模型的估计值与线性模型相吻合-如果随机斜率存在差异,这对于具有随机截距和斜率的随机效应模型也成立吗?
benjamin jarcuska 2014年

2
是的,无论随机效应结构如何,随机效应模型中固定效应的估计值与边际模型中均值模型的估计值都是一致的。
兰德尔2014年

只是想知道是否有人会碰巧在R中使用这两种建模方法的实例?也许对于这个特定的例子,似乎很讲究?
Tom Wenseleers 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.