Answers:
您观察到的行为是逻辑回归中的“典型”情况,但并非总是如此。它还具有更广泛的通用性(请参见下文)。这是三个不同事实汇合的结果。
如果不存在上述任何一项,则平均估计概率通常将不匹配样本中那些概率的比例。
但是,(几乎)所有统计软件都对此类模型使用最大似然估计,因此,在实践中,除特殊情况外,基本上始终存在第1项和第2项,而通常存在第3项。
一些细节
在典型的逻辑回归框架中,我们以概率观察独立的二项式试验的结果。让Ÿ 我是观察到的反应。那么总似然为 L = n ∏ i = 1 p y i i(1 - p i )1 - y i = n ∏ i = 1 exp (y i log (p i /(1 - p i 因此对数似然为 ℓ = n ∑ i = 1 y i log (p i /(1 − p i))+ n ∑ i = 1 log (1 − p i)
现在,对于每个观察,我们都有一个预测变量的向量,根据上述事实1,逻辑回归模型假定 log p i 对于参数 β的一些未知向量。注:通过重新安排这,我们得到 p 我 = 1 /(1 + Ë - β 牛逼X我)。
使用最大似然以适应模型(事实2)得到一组方程,从考虑解决。观察 ∂&ℓ
模拟
x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )
一般情况:如前所述,平均响应等于平均预测均值的性质对于使用最大似然性的广义线性模型类别(使用规范链接函数)并在其中包含截距具有更大的通用性。模型。
参考文献
以下是相关理论的一些很好的参考。