Logistic回归可以描述为线性组合
η= β0+ β1个X1个+ 。。。+ βķXķ
通过链接函数传递:G
G(E(是))= η
链接功能是登录功能
Ë(是| X,β)= p = logit− 1(η)
其中采取仅在值{ 0 ,1 }和逆分对数变换的功能线性组合η于该范围。这就是经典逻辑回归的终点。Y{0,1}η
但是,如果你还记得,对于只需要在值的变量{ 0 ,1 },比Ë (Ÿ | X ,β )可以被视为P (Ÿ = 1 | X ,β )。在这种情况下,可以将logit函数输出视为“成功”的条件概率,即P (Y = 1 | X ,E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)。伯努利分布是一种描述观察二进制结果的概率的分布,带有一些 p参数,因此我们可以将 Y描述为P(Y=1|X,β)pY
yi∼Bernoulli(p)
因此,通过逻辑回归,我们寻找一些参数,它们与独立变量X一起构成线性组合η。在经典回归È (Ý | X ,β )= η(我们假定为恒等函数链接功能),但是到模型Ý,取入的值{ 0 ,1 },我们需要变换η所以,以适应在[ 0 ,1 ]范围。βXηE(Y|X,β)=ηY{0,1}η[0,1]
现在,为了估计在贝叶斯方式logistic回归你拿起一些先验参数与线性回归(参见Kruschke等人,2012),然后使用分对数函数来转换线性组合η,所以利用其输出作为p描述您的Y变量的伯努利分布参数。因此,是的,您实际上使用等式和logit链接函数的方法与在偏见情况下的方法相同,其余的工作(例如选择先验条件)类似于估计贝叶斯方法的线性回归。βiηpY
用于选择先验的简单的方法是选择正常分布(但也可以使用其它分布,例如 -或拉普拉斯分布为更稳健的模型)为β 我的带有参数μ 我和σ 2 我被预先设定或取自等级先验。现在,有了模型定义,您就可以使用JAGS之类的软件来进行Markov Chain Monte Carlo仿真,以估算模型。下面,我发布了用于简单物流模型的JAGS代码(请在此处查看更多示例)。tβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
如您所见,代码直接转换为模型定义。什么软件做的是它吸引了来自普通先验一些值a
和b
,然后使用这些值来估算p
,最后,用似然函数来评估可能给出的参数数据(这是当你使用贝叶斯定理,看到这里的更详细的说明)。
可以扩展基本逻辑回归模型,以使用分层模型(包括hyperprior)对预测变量之间的依赖性进行建模。在这种情况下,你可以画 “从s 多元正态分布,使我们能够包括有关协方差信息Σ自变量之间βiΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
...但是这很详细,所以让我们在这里停止。
这里的“贝叶斯”部分是使用贝叶斯定理并以概率术语定义模型来选择先验。看到这里的“贝叶斯模型”的定义,并在这里对一些贝叶斯方法一般直觉。您还可以注意到,使用这种方法定义模型非常简单和灵活。
Kruschke,JK,Aguinis,H.&Joo,H.(2012年)。现在到了:组织科学中用于数据分析的贝叶斯方法。 组织研究方法,15(4),722-752。
Gelman,A.,Jakulin,A.,Pittau,GM和Su,Y.-S. (2008)。逻辑模型和其他回归模型的信息量很少的默认先验分布。 应用统计年鉴,2(4),1360–1383。