Logistic回归的最大似然估计器的偏差


10

我想了解有关Logistic回归的最大似然估计器(MLE)的几个事实。

  1. 总的来说,逻辑回归的MLE是否存在偏见?我会说“是”。我知道,例如,样本维数与MLE的渐近偏差有关。

    您知道这种现象的基本例子吗?

  2. 如果MLE有偏差,那么MLE的协方差矩阵是否是最大似然函数的Hessian的逆是真的吗?

    编辑:我经常遇到这个公式,没有任何证据;在我看来,这是一个相当随意的选择。

Answers:


15

考虑简单的二元逻辑回归模型,与二进制因变量和唯一的常数和一个二进制回归。 其中\ Lambda是逻辑CDF,\ Lambda(u)= \ left [1+ \ exp \ {-u \} \ right] ^ {-1}T

Pr(Yi=1Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{u}]1

在logit形式中,我们有

ln(Pr(Yi=1Ti=1)1Pr(Yi=1Ti=1))=α+βTi

您有一个大小为的样本。表示个观察数,其中,,其中,。考虑以下估计的条件概率:nn1Ti=1n0Ti=0n1+n0=n

Pr^(Y=1T=1)P^1|1=1n1Ti=1yi

Pr^(Y=1T=0)P^1|0=1n0Ti=0yi

然后,这个非常基本的模型为ML估计器提供了封闭式解决方案:

α^=ln(P^1|01P^1|0),β^=ln(P^1|11P^1|1)ln(P^1|01P^1|0)

偏压

尽管和是相应概率的无偏估计量,但MLE还是有偏的,因为非线性对数函数会妨碍您-想像一下更复杂的模型会发生什么,具有更高的非线性度。P^1|1P^1|0

但是渐近地,由于概率估计是一致的,所以偏差消失了。将运算符直接插入期望值和对数内,我们得到 lim

limnE[α^]=E[ln(limnP^1|01P^1|0)]=E[ln(P1|01P1|0)]=α

和。 β

MLE
的方差-协方差矩阵在上述为估计量提供封闭式表达式的简单情况下,至少可以在原则上继续推导其精确的有限样本分布,然后计算其精确的有限样本方差-协方差矩阵。但是总的来说,MLE没有封闭形式的解决方案。然后,我们求助于渐进方差-协方差矩阵的一致估计,该矩阵的确是样本的对数似然函数的Hessian的Hessian的逆(在MLE上估计)。此处根本没有“任意选择”,但这是由MLE的渐近理论和渐近性质(一致性和渐近正态性)得出的,它告诉我们,对于, θ0=(α,β)

n(θ^θ0)dN(0,(E[H])1)

其中是黑森州。对于(大)有限样本,这近似导致我们H

Var(θ^)1n(E[H])11n(1nH^)1=H^1
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.