作为广义线性模型输出的一部分,零偏差和残差偏差用于评估模型。我经常看到这些量的饱和模型的对数似然来表示的公式,例如:/stats//a/113022/22199,Logistic回归:如何获取饱和模型
据我所知,饱和模型是完全符合观察到的响应的模型。因此,在我见过的大多数地方,饱和模型的对数似然始终为零。
但是,给出偏差公式的方式表明,有时该量不为零。(好像总是始终为零,为什么还要包括它?)
在什么情况下可以为非零?如果它永远都不为零,为什么要在偏差公式中包括它?
作为广义线性模型输出的一部分,零偏差和残差偏差用于评估模型。我经常看到这些量的饱和模型的对数似然来表示的公式,例如:/stats//a/113022/22199,Logistic回归:如何获取饱和模型
据我所知,饱和模型是完全符合观察到的响应的模型。因此,在我见过的大多数地方,饱和模型的对数似然始终为零。
但是,给出偏差公式的方式表明,有时该量不为零。(好像总是始终为零,为什么还要包括它?)
在什么情况下可以为非零?如果它永远都不为零,为什么要在偏差公式中包括它?
Answers:
如果您真的要说对数似然,那么答案是:它并不总是为零。
例如,考虑泊松数据:。对数似然由下式给出:
微分在相对于并将其设置为(这是我们如何获得MLE饱和模型): 解决为以获得,然后将入为可得出饱和模型的对数似然为: 除非取非常特殊价值观。(* )μ 我 0 - 1 + ÿ 我μ我 μ我=ÿ我 μ我(*)μ我ℓ( μ ;Ý)=Ñ Σ我=1Ÿ我(登录ÿ我-1)-ñ Σ我
在的帮助页面R
的功能glm
,在该项目下deviance
,该文件解释了这个问题,如下所示:
deviance
最多减去一个常数,即最大对数可能性的两倍。在合理的情况下,选择常数可以使饱和模型的偏差为零。
注意,它提到将偏差模型而不是饱和模型的对数似然选择为零。
可能您真正想确认的是“ 饱和模型的偏差始终为零”,这是正确的,因为根据定义,偏差(请参阅Alan 分类数据分析(第2版,第4.5.1节)) Agresti是指定GLM与饱和模型的似然比统计量。constant
R文档中的上述内容实际上是饱和模型最大化对数似然性的两倍。
关于您的陈述“但是,给出偏差的公式的方式表明该数量有时不为零。”,这可能是由于滥用术语“ 偏差”造成的。例如,在R,比较两个的似然比统计任意(嵌套的)模型和也被称为偏离,这将被更精确地称为该差的偏差之间和的偏差,如果我们严格遵循Agresti书中的定义。M 2 M 1 M 2
结论
饱和模型的对数似然通常为非零。
饱和模型的偏差(按其原始定义)为零。
软件(例如R)的偏差输出通常为非零值,因为它实际上表示其他含义(偏差之间的差异)。
以下是一般指数族情况的推导和另一个具体示例。假设数据来自指数族(请参见《现代应用统计》第S章,第章): ,其中是已知的先验权重,是色散/比例参数(在许多情况下,例如二项式和Poisson,此参数是已知的,而在其他情况下,例如法线和Gamma,此参数是未知的)。然后,对数似然由下式给出: ˚F (ÿ 我 ; θ 我,φ )= EXP [ 甲我(ÿ 我θ 我 - γ (θ 我))/ φ + τ (Ý 我,φ / 甲我)] 。甲我 φ ℓ (θ ,φ ; ÿ )= Ñ Σ我= 1个甲
用表示上述方程式的解,则饱和模型的对数似然的一般形式(将比例参数作为常数进行处理)为:
在我的上一个答案中,我错误地指出右侧的第一项始终为零,以上泊松数据示例证明了它是错误的。对于更复杂的示例,请考虑附录中给出的Gamma分布。
饱和Gamma模型的对数似然中第一项的证明不是零:给定 我们必须首先进行重新参数化,以便具有指数族形式。如果让 则具有以下表示形式: 其中
詹雄的答案已经是不错的(+1),但这是一个快速演示,它显示了对数回归的饱和模型的对数似然为。我以为我会发表,因为我还没有在这个网站上看到过这个TeX,而且因为我只是写了这些来作演讲。
可能性为
,其中。
对数似然是
如果对所有系数取导数,则
将此表达式设置为等于并求解将为您提供答案。通常这不能通过分析来完成,这可以解释使用迭代算法来拟合该模型的普遍性/必要性,但是在饱和模型的情况下,这是可能的。
为了找到饱和模型,我们给每一行赋予它自己的系数。因此设计矩阵乘以系数向量就是
请注意,尤其是。
因此,取等式(2)的第行给我们
只有对于每个观察值,这才是正确的:
glm( cbind(k, n-k) ~ x + ...
@Alex:是的,没错。至少对于离散分布。对于连续分布,归结为让密度等于1,这不一定有意义,因此尝试实现也不是明智的选择。一般而言,饱和模型的对数似然性为您提供了遵循基础分布族假设的任何模型的性能上限。换句话说,假设Y是二项式,对于给定的数据集(X,Y),饱和二项式模型的对数似然率“尽可能好”。将您的glm模型与此上限(而不是100%(或类似值))进行比较是有意义的,因为您的模型固有地受响应分布假设的约束。