考虑简单的二元逻辑回归模型,与二进制因变量和唯一的常数和一个二进制回归。
其中\ Lambda是逻辑CDF,\ Lambda(u)= \ left [1+ \ exp \ {-u \} \ right] ^ {-1}。T
Pr(Yi=1∣Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{−u}]−1
在logit形式中,我们有
ln(Pr(Yi=1∣Ti=1)1−Pr(Yi=1∣Ti=1))=α+βTi
您有一个大小为的样本。表示个观察数,其中,,其中,。考虑以下估计的条件概率:nn1Ti=1n0Ti=0n1+n0=n
Pr^(Y=1∣T=1)≡P^1|1=1n1∑Ti=1yi
Pr^(Y=1∣T=0)≡P^1|0=1n0∑Ti=0yi
然后,这个非常基本的模型为ML估计器提供了封闭式解决方案:
α^=ln(P^1|01−P^1|0),β^=ln(P^1|11−P^1|1)−ln(P^1|01−P^1|0)
偏压
尽管和是相应概率的无偏估计量,但MLE还是有偏的,因为非线性对数函数会妨碍您-想像一下更复杂的模型会发生什么,具有更高的非线性度。P^1|1P^1|0
但是渐近地,由于概率估计是一致的,所以偏差消失了。将运算符直接插入期望值和对数内,我们得到
lim
limn→∞E[α^]=E[ln(limn→∞P^1|01−P^1|0)]=E[ln(P1|01−P1|0)]=α
和。 β
MLE
的方差-协方差矩阵在上述为估计量提供封闭式表达式的简单情况下,至少可以在原则上继续推导其精确的有限样本分布,然后计算其精确的有限样本方差-协方差矩阵。但是总的来说,MLE没有封闭形式的解决方案。然后,我们求助于渐进方差-协方差矩阵的一致估计,该矩阵的确是样本的对数似然函数的Hessian的Hessian的逆(在MLE上估计)。此处根本没有“任意选择”,但这是由MLE的渐近理论和渐近性质(一致性和渐近正态性)得出的,它告诉我们,对于,
θ0=(α,β)
n−−√(θ^−θ0)→dN(0,−(E[H])−1)
其中是黑森州。对于(大)有限样本,这近似导致我们H
Var(θ^)≈−1n(E[H])−1≈−1n(1nH^)−1=−H^−1