贝叶斯logit模型-直观的解释?


11

我必须承认,我以前从未在本科或研究生班上听说过该词。

Logistic回归为贝叶斯是什么意思?我正在寻找从常规物流到贝叶斯物流的过渡解释,类似于以下内容:

这是线性回归模型的方程:Ëÿ=β0+β1个X1个++βñXñ

这是逻辑回归模型中的方程式:。当y是绝对值时完成此操作。lnËÿ1个-Ëÿ=β0+β1个X1个++βñXñ

我们要做的是将更改为。ËÿlnËÿ1个-Ëÿ

那么在贝叶斯逻辑回归中对逻辑回归模型做了什么?我猜想这与方程式无关。

本书的预览似乎定义了,但我不太了解。这些先前的可能性是什么?是什么?有人可以用另一种方式解释本书的这一部分或贝叶斯逻辑模型吗?α

注意:这是我之前问过的,但回答得不是很好。


1
我不想回答这个问题,因为我认为@Tim涵盖了大部分内容。唯一没有想到的是,在更一般的贝叶斯逻辑回归和贝叶斯广义线性模型(GLM)中,先验分布不仅位于系数上,而且位于这些系数的方差和协方差上。提到这一点非常重要,因为针对GLM的贝叶斯方法的主要优点之一是指定系数的较大可处理性,并且在许多情况下,还可以拟合复杂的系数协方差模型。
垃圾平衡

2
@BrashEquilibrium:您提到的是Logit模型的标准贝叶斯建模的可能层次扩展。在我们的书中,我们在上使用了一个g 优先级,在此之前,固定协方差矩阵是从协变量X导出的。βX
西安

1
在g之前足够公平。
垃圾平衡

1
也就是说,协方差仍然存在先验!!!!!!!!! 如果您不讨论它,就不会描述逻辑回归如何完全起作用。
垃圾平衡

Answers:


19

Logistic回归可以描述为线性组合

η=β0+β1X1+...+βkXk

通过链接函数传递:g

g(E(Y))=η

链接功能是登录功能

E(Y|X,β)=p=logit1(η)

其中采取仅在值{ 0 1 }和逆分对数变换的功能线性组合η于该范围。这就是经典逻辑回归的终点。Y{0,1}η

但是,如果你还记得,对于只需要在值的变量{ 0 1 },比Ë Ÿ | X β 可以被视为P Ÿ = 1 | X β 。在这种情况下,可以将logit函数输出视为“成功”的条件概率,即P Y = 1 | X E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)伯努利分布是一种描述观察二进制结果的概率的分布,带有一些 p参数,因此我们可以将 Y描述为P(Y=1|X,β)pY

yiBernoulli(p)

因此,通过逻辑回归,我们寻找一些参数,它们与独立变量X一起构成线性组合η。在经典回归È Ý | X β = η(我们假定为恒等函数链接功能),但是到模型Ý,取入的值{ 0 1 },我们需要变换η所以,以适应在[ 0 1 ]范围。βXηE(Y|X,β)=ηY{0,1}η[0,1]

现在,为了估计在贝叶斯方式logistic回归你拿起一些先验参数与线性回归(参见Kruschke等人,2012),然后使用分对数函数来转换线性组合η,所以利用其输出作为p描述您的Y变量的伯努利分布参数。因此,是的,您实际上使用等式和logit链接函数的方法与在偏见情况下的方法相同,其余的工作(例如选择先验条件)类似于估计贝叶斯方法的线性回归。βiηpY

用于选择先验的简单的方法是选择正常分布(但也可以使用其它分布,例如 -或拉普拉斯分布为更稳健的模型)为β 的带有参数μ σ 2 被预先设定或取自等级先验。现在,有了模型定义,您就可以使用JAGS之类的软件来进行Markov Chain Monte Carlo仿真,以估算模型。下面,我发布了用于简单物流模型的JAGS代码(请在此处查看更多示例)。tβiμiσi2

model {
   # setting up priors
   a ~ dnorm(0, .0001)
   b ~ dnorm(0, .0001)

   for (i in 1:N) {
      # passing the linear combination through logit function
      logit(p[i]) <- a + b * x[i]

      # likelihood function
      y[i] ~ dbern(p[i])
   }
}

如您所见,代码直接转换为模型定义。什么软件做的是它吸引了来自普通先验一些值ab,然后使用这些值来估算p,最后,用似然函数来评估可能给出的参数数据(这是当你使用贝叶斯定理,看到这里的更详细的说明)。

可以扩展基本逻辑回归模型,以使用分层模型(包括hyperprior)对预测变量之间的依赖性进行建模。在这种情况下,你可以画 “从s 多元正态分布,使我们能够包括有关协方差信息Σ自变量之间βiΣ

β0β1个βķ中号Vñ[μ0μ1个μķ][σ02σ01个σ0ķσ1个0σ1个2σ1个ķσķ0σķ1个σķ2]

...但是这很详细,所以让我们在这里停止。

这里的“贝叶斯”部分是使用贝叶斯定理并以概率术语定义模型来选择先验。看到这里的“贝叶斯模型”的定义,并在这里对一些贝叶斯方法一般直觉。您还可以注意到,使用这种方法定义模型非常简单和灵活。


Kruschke,JK,Aguinis,H.&Joo,H.(2012年)。现在到了:组织科学中用于数据分析的贝叶斯方法。 组织研究方法,15(4),722-752。

Gelman,A.,Jakulin,A.,Pittau,GM和Su,Y.-S. (2008)。逻辑模型和其他回归模型的信息量很少的默认先验分布。 应用统计年鉴,2(4),1360–1383。


1
您需要证明方差,而不仅仅是系数。
垃圾平衡

3
@BCLC没有,用于逻辑回归分对数被用作链路功能,而η是线性组合η = β 0 + β 1 X 1,例如用于线性回归是恒等函数,以便È Ý = η,这仅仅是GLM的标准规范。Gηη=β0+β1个X1个GËÿ=η
蒂姆

1
@BCLC检查我的答案中的链接,它们提供了贝叶斯统计信息的一般介绍。这是您最初的问题中提到的一个更广泛的话题,但是您可以在我在回答中提供的参考文献中找到很好的介绍。
蒂姆

1
@Tim我在那里打错字了。证明应该先验。基本上,系数并不是唯一未知的参数。多项式分布还具有方差协方差矩阵,通常我们不知道它是已知的。
垃圾平衡

3
“这里的“贝叶斯”部分是选择先验,使用贝叶斯定理并以概率术语定义模型。” Gelman等人是一个很好的参考。逻辑模型和其他回归模型的较弱信息默认先验分布stat.columbia.edu/~gelman/research/published/priors11.pdf
Dalton Hance

6

这些先前的可能性是什么?

这就是使它成为贝叶斯的原因。数据的生成模型相同;不同之处在于,贝叶斯分析为感兴趣的参数选择了一些先验分布,并计算或近似了后验分布,所有推断均基于该后验分布。贝叶斯规则涉及两个:后验与先验的似然时间成正比。

β

某些频繁出现的模型可能与具有特定先验的贝叶斯对应模型相关联,尽管我不确定在这种情况下哪个模型相对应。


βββ1,β2,...,βnX1X2Xnβ

1
@BCLC为了回答这些问题,我将从贝叶斯推断的简单过程开始,然后按我定义的术语进行操作:贝叶斯将所有感兴趣的参数视为随机变量,并根据数据更新对这些参数的信念。在分析数据之前,先验分布表示对参数的信念;*后验分布*(根据贝叶斯规则,即先验和似然的归一化乘积)根据先验和数据总结了对参数的不确定信念。计算后验是进行拟合的地方。
肖恩·复活节

1
βpp

好吧,我读完“机会论”中的一个解决问题的论文后,我认为我对你的理解更好。感谢SeanEster
BCLC 2015年

1
P(B)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.