在GLM中,饱和模型的对数似然性是否始终为零?


14

作为广义线性模型输出的一部分,零偏差和残差偏差用于评估模型。我经常看到这些量的饱和模型的对数似然来表示的公式,例如:/stats//a/113022/22199Logistic回归:如何获取饱和模型

据我所知,饱和模型是完全符合观察到的响应的模型。因此,在我见过的大多数地方,饱和模型的对数似然始终为零。

但是,给出偏差公式的方式表明,有时该量不为零。(好像总是始终为零,为什么还要包括它?)

在什么情况下可以为非零?如果它永远都不为零,为什么要在偏差公式中包括它?

Answers:


18

如果您真的要说对数似然,那么答案是:它并不总是为零。

例如,考虑泊松数据:。对数似然由下式给出: yiPoisson(μi),i=1,,nY=(y1,,yn)

()(μ;Y)=i=1nμi+i=1nyilogμii=1nlog(yi!).

微分在相对于并将其设置为(这是我们如何获得MLE饱和模型): 解决为以获得,然后将入为可得出饱和模型的对数似然为: 除非取非常特殊价值观。* μ 0 - 1 + ÿ (μ;Y)()μi0μ μ=ÿ μ*μ μ ;Ý=Ñ Σ=1Ÿ登录ÿ-1-ñ Σ

1+yiμi=0.
μiμ^i=yiμ^i()μiyi
(μ^;Y)=i=1nyi(logyi1)i=1nlog(yi!)0
yi

在的帮助页面R的功能glm,在该项目下deviance,该文件解释了这个问题,如下所示:

deviance 最多减去一个常数,即最大对数可能性的两倍。在合理的情况下,选择常数可以使饱和模型的偏差为零。

注意,它提到将偏差模型而不是饱和模型的对数似然选择为零。

可能您真正想确认的是“ 饱和模型的偏差始终为零”,这是正确的,因为根据定义,偏差(请参阅Alan 分类数据分析(第2版,第4.5.1节)) Agresti是指定GLM与饱和模型的似然比统计量。constantR文档中的上述内容实际上是饱和模型最大化对数似然性的两倍。

关于您的陈述“但是,给出偏差的公式的方式表明该数量有时不为零。”,这可能是由于滥用术语“ 偏差”造成的。例如,在R,比较两个的似然比统计任意(嵌套的)模型和也被称为偏离,这将被更精确地称为的偏差之间和的偏差,如果我们严格遵循Agresti书中的定义。M 2 M 1 M 2M1M2M1M2

结论

  1. 饱和模型的对数似然通常为非零。

  2. 饱和模型的偏差(按其原始定义)为零。

  3. 软件(例如R)的偏差输出通常为非零值,因为它实际上表示其他含义(偏差之间的差异)。


以下是一般指数族情况的推导和另一个具体示例。假设数据来自指数族(请参见《现代应用统计》S章,第章): ,其中是已知的先验权重,是色散/比例参数(在许多情况下,例如二项式和Poisson,此参数是已知的,而在其他情况下,例如法线和Gamma,此参数是未知的)。然后,对数似然由下式给出: ˚F ÿ ; θ φ = EXP [ ÿ θ - γ θ / φ + τ Ý φ / ] φ θ φ ; ÿ = Ñ Σ= 1个7

(1)f(yi;θi,φ)=exp[Ai(yiθiγ(θi))/φ+τ(yi,φ/Ai)].
Aiφ
(θ,φ;Y)=i=1nAi(yiθiγ(θi))/φ+i=1nτ(yi,φ/Ai).
如在Poisson示例中一样,可以通过求解以下得分函数来估计饱和模型的参数:
0=U(θi)=(θ,φ;Y)θi=Ai(yiγ(θi))φ

用表示上述方程式的解,则饱和模型的对数似然的一般形式(将比例参数作为常数进行处理)为: θ^i

()(θ^,φ;Y)=i=1nAi(yiθ^iγ(θ^i))/φ+i=1nτ(yi,φ/Ai).

在我的上一个答案中,我错误地指出右侧的第一项始终为零,以上泊松数据示例证明了它是错误的。对于更复杂的示例,请考虑附录中给出的Gamma分布。()Γ(α,β)


饱和Gamma模型的对数似然中第一项的证明不是零:给定 我们必须首先进行重新参数化,以便具有指数族形式。如果让 则具有以下表示形式: 其中

f(y;α,β)=βαΓ(α)eβyyα1,y>0,α>0,β>0,
f(1)
φ=1α,θ=βα,
f
f(y;θ,φ)=exp[θy(log(θ))φ+τ(y,φ)],
τ(y,φ)=logφφ+(1φ1)logylogΓ(φ1).
因此,饱和模型的MLE为。因此 除非取非常特殊的值。θ^i=1yi
i=1n1φ[θ^iyi(log(θ^i))]=i=1n1φ[1log(yi)]0,
yi

1
当且仅当模型可以为每个可能的结果分配100%的概率时,对数可能性为零吗?
亚历克斯

我不太明白你的意思。但是从我的派生你可能会认为它是,当且仅当是相同的,没有分散参数。0τ0
詹雄2015年

您的推论非常好,但目前的正式证明略高于我的头。感谢您提供的泊松模型示例。我从该示例中得出的结论是,在给定Poisson平均值的任何值的情况下,泊松模型无法将100%的概率分配给观察到的结果,因此可能性不可能为零。
亚历克斯

语句“模型将概率分配给观察到的结果”对我来说听起来很奇怪。您是说给定观测值,并且如果是泊松随机变量,则?100%y1,,ynYP(Y=y1)+P(Y=y2)++P(Y=yn)<1
詹雄2015年

1
我的意思是,如果是泊松随机变量,则对于任何或泊松均值,,因此,不可能找到任何模型参数为观察到的对数提供零。也许我完全误解了饱和模型的概念。YP(Y=yi)<1i
Alex

4

詹雄的答案已经是不错的(+1),但这是一个快速演示,它显示了对数回归的饱和模型的对数似然为。我以为我会发表,因为我还没有在这个网站上看到过这个TeX,而且因为我只是写了这些来作演讲。0

可能性为 ,其中。

(1)L(y;X,β)=i=1nf(yi;xi,β)=i=1nπiyi(1πi)1yi=i=1n(πi1πi)yi(1πi)
πi=invlogit(xiβ)

对数似然是

logL(y;X,β)=i=1nyilog(πi1πi)+log(1πi)=i=1nyilogit(πi)+log(1πi)=i=1nyixiβ+log(1invlogit(xiβ))=i=1nyixiβ+log(invlogit(xiβ))=i=1nyixiβlog(1+exp[xiβ]))

如果对所有系数取导数,则

(2)(β)=i=1nyixiexp[xiβ](1+exp[xiβ])xi.

将此表达式设置为等于并求解将为您提供答案。通常这不能通过分析来完成,这可以解释使用迭代算法来拟合该模型的普遍性/必要性,但是在饱和模型的情况下,这是可能的。0β

为了找到饱和模型,我们给每一行赋予它自己的系数。因此设计矩阵乘以系数向量就是 βRn

Xβ=[100010001][β1β2βn].

请注意,尤其是。xiβ=βi

因此,取等式(2)的第行给我们 j

i=1nyixi,j=i=1nexp[xiβ](1+exp[xiβ])xi,j

只有对于每个观察值,这才是正确的:i

yi=invlogit(βi)
,换句话说,每个为正负无穷大(如果分别为或)。我们可以将这些参数重新插入(1)中以获得最大可能性: 显然,它的对数是。βiyi10
i=1nπ^iyi(1π^i)1yi=1n=1.
0


但这假设未分组的数据。如果您具有(并且具有相同的协变量值)的组(例如,使用R形式在R中),则饱和模型不具有对数似然零。ni>1glm( cbind(k, n-k) ~ x + ...
kjetil b halvorsen

@kjetilbhalvorsen哦,好点。我从未尝试过让我检查一下
泰勒

1

@Alex:是的,没错。至少对于离散分布。对于连续分布,归结为让密度等于1,这不一定有意义,因此尝试实现也不是明智的选择。一般而言,饱和模型的对数似然性为您提供了遵循基础分布族假设的任何模型的性能上限。换句话说,假设Y是二项式,对于给定的数据集(X,Y),饱和二项式模型的对数似然率“尽可能好”。将您的glm模型与此上限(而不是100%(或类似值))进行比较是有意义的,因为您的模型固有地受响应分布假设的约束。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.