逻辑回归中简单预测对优势比的解释


29

我对使用逻辑回归有些陌生,并且对以下值的解释之间的差异有些困惑,我认为这是相同的:

  • 指数贝塔值
  • 使用beta值预测结果的可能性。

这是我使用的模型的简化版本,营养不足和保险都是二进制的,财富是连续的:

Under.Nutrition ~ insurance + wealth

我的(实际)模型返回的保险指数值为0.8,我将其解释为:

“被保险人营养不足的概率是未保险人营养不足的概率的0.8倍。”

但是,当我通过将0和1的值分别输入保险变量和财富平均值来计算个人的概率差异时,营养不足的差异仅为0.04。计算公式如下:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

如果有人可以解释为什么这些值不同,以及什么是更好的解释(尤其是第二个值),我将不胜感激。


进一步的澄清编辑
据我了解,未投保的人(其中B1对应于保险)营养不足的可能性为:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

虽然被保险人营养不足的可能性是:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

与参保人相比,未参保人营养不良的几率是:

exp(B1)

有没有一种方法可以在数学上转换这些值?我仍然对这个公式感到困惑(在RHS中,我可能应该是一个不同的值):

Prob(Ins) - Prob(Unins) != exp(B)

用外行人的话来说,问题是为什么不保证个人营养不足的几率能像优势比所表明的那样改变呢?在我的数据中,Prob(Ins)-Prob(Unins)= .04,其中幂指数的beta值为.8(所以为什么差值不是0.2?


2
这些奇妙而清晰的解释是否适用于对数逻辑模型/回归?

Answers:


50

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

让我知道您是否需要其他/不同的信息。

更新:
我认为这主要是一个不熟悉概率和几率以及它们之间的关系的问题。这些都不是很直观的,您需要坐下来工作一会儿,然后学会用这些术语思考。任何人都不自然。

问题是绝对数字很难自行解释。可以说我是在告诉你我有硬币的时候,我想知道这是否公平。所以我翻了一下,得到了6个头。这意味着什么?6差不多吗?很难说。为了解决这个问题,我们想给数字一些背景。在这种情况下,有两种明显的选择可以提供所需的上下文:我可以给出翻转的总数,也可以给出尾巴的数量。无论哪种情况,您都有足够的信息可以理解6个头,并且如果我告诉您的那个不是您喜欢的那个,则可以计算另一个值。概率是正面数除以事件总数。赔率是正面数与正面数之比。

probability=odds1+odds                odds=probability1probability
exp(β)

[0,1](,+)(0,+)wealth

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(尽管它是在另一个问题的上下文中编写的,但我在这里的答案包含有关逻辑回归的许多信息,这些信息可能有助于您更全面地了解LR和相关问题。)


感谢您的回复-我在上面的编辑中进一步解释了我的困惑。
mike 2012年

非常感谢您抽出宝贵时间写出完整的解释-非常有帮助。
mike 2012年

不客气,@ mike,这就是简历的意思。
gung-恢复莫妮卡

关于“ 拉斯维加斯赔率”链接:我从未去过拉斯维加斯,但是在寻找以拉斯维加斯为基地的网站提供的一些价格时,他们在报价中采用小数赔率(而不是货币线),他们遵循英国的“赔率赔率”制度,而不是统计上“赔率高”。因此,您链接上的“拉斯维加斯赔率”并不对应实际的赌博赔率,其中“ 9比1”是不太可能发生的事件,而不是(因为“ 9比1”对统计学家来说是可能的)!我想在这里解决的困惑之源
Silverfish'Nov

@Silverfish,我很久没去过拉斯维加斯了。我不记得他们通常列出赔率还是赔率。但是,“ 4比5”被称为拉斯维加斯赔率
gung-恢复莫妮卡


-1

几率OR = Exp(b)转换为概率A = SQRT(OR)/(SQRT(OR)+1),其中概率A是事件A的概率,或OR是发生事件A /未发生事件A的比率(或上面问题中的保险暴露/未暴​​露)。我花了很长时间才解决。我不确定为什么不是众所周知的公式。

有一个例子。假设有10人被大学录取;其中有7个人是男人。因此,对于每个男人来说,有70%的概率被录取。男性被录取的几率是7/3 = 2.33,而不是3/7 = 0.43。几率(OR)为2.33 / 0.43 = 5.44,这意味着,男性的录取几率是女性的5.44倍。让我们从OR中找到被男性接纳的概率:P = SQRT(5.44)/(SQRT(5.44)+1)= 0.7

更新 仅当被录取的男女人数等于申请人数时,才如此。换句话说,它不是OR。在不知道其他信息的情况下,我们无法发现概率增益(或损失)取决于因素。


7232

是的,您绝对正确,谢谢。我发现,在不知道有关先验概率的信息的情况下,我们无法将已知的OR(例如,作为逻辑回归输出得到的)转换为概率的得失。我将更新添加到我的答案中。
Niksr 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.