我对使用逻辑回归有些陌生,并且对以下值的解释之间的差异有些困惑,我认为这是相同的:
- 指数贝塔值
- 使用beta值预测结果的可能性。
这是我使用的模型的简化版本,营养不足和保险都是二进制的,财富是连续的:
Under.Nutrition ~ insurance + wealth
我的(实际)模型返回的保险指数值为0.8,我将其解释为:
“被保险人营养不足的概率是未保险人营养不足的概率的0.8倍。”
但是,当我通过将0和1的值分别输入保险变量和财富平均值来计算个人的概率差异时,营养不足的差异仅为0.04。计算公式如下:
Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
(1+exp(β0 + β1*Insurance + β2*wealth))
如果有人可以解释为什么这些值不同,以及什么是更好的解释(尤其是第二个值),我将不胜感激。
进一步的澄清编辑
据我了解,未投保的人(其中B1对应于保险)营养不足的可能性为:
Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
(1+exp(β0 + β1*0+ β2*wealth))
虽然被保险人营养不足的可能性是:
Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
(1+exp(β0 + β1*1+ β2*wealth))
与参保人相比,未参保人营养不良的几率是:
exp(B1)
有没有一种方法可以在数学上转换这些值?我仍然对这个公式感到困惑(在RHS中,我可能应该是一个不同的值):
Prob(Ins) - Prob(Unins) != exp(B)
用外行人的话来说,问题是为什么不保证个人营养不足的几率能像优势比所表明的那样改变呢?在我的数据中,Prob(Ins)-Prob(Unins)= .04,其中幂指数的beta值为.8(所以为什么差值不是0.2?