为什么在伯努利参数上使用beta分布进行分层逻辑回归?


13

我目前正在阅读Kruschke出色的“做贝叶斯数据分析”书。但是,有关分层逻辑回归的章节(第20章)有些令人困惑。

图20.2描述了分层逻辑回归,其中伯努利参数被定义为通过S型函数转换的系数的线性函数。我在其他在线资源中也看到了大多数示例,这似乎是构成分层逻辑回归的方式。例如-http: //polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

但是,当预测变量是名义变量时,他在层次结构中添加了一层-Bernoulli参数现在从beta分布中绘制(图20.5),其参数由mu和kappa确定,其中mu是系数线性函数的S形变换。 ,而kappa使用伽玛优先级。

这似乎是合理的,类似于第9章中的掷硬币示例,但是我不认为名义上的预测变量与添加beta分布有什么关系。在度量标准预测变量的情况下,为什么不这样做?为什么为名义预测变量增加了beta分布?

编辑:澄清我所指的模型。首先,具有指标预测变量的逻辑回归模型(之前没有beta)。这类似于分层逻辑回归的其他示例,例如上面的错误示例:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

然后是带有名义预测变量的示例。在这里,我不太了解层次结构的“较低”级别的作用(将逻辑结果纳入二项式分析的beta中),以及为什么它应与度量示例有所不同。

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

Answers:


9

您比较的两个模型具有许多其他功能,我认为您可以在以下两个简化模型的背景下更清楚地陈述您的问题:

模型1:

yi|μiBern(μi)μiπ(μi)

模型2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

您的问题是:(1)Beta发行版扮演什么角色;与之相关的(2)模型2与模型1有什么不同(如果有的话)?

μiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

θi


5

从贝塔分布中得出伯努利参数的原因是,贝塔与二项式共轭。使用共轭先验分布可以使闭合形式的解找到后验。

编辑:澄清。两种模型都可以。即使使用MCMC,使用共轭先验也是有用的,因为它允许将专用采样器用于各种类型的分布,这比通用采样器更有效。例如,请参见JAGS用户手册sec。4.1.1和sec 4.2。


我的书中可能没有足够的上下文,但是这些分析是使用Gibbs采样进行的,因此后验的闭合形式表示不是必需的。在我链接的示例中,bernoulli参数不是固定为beta分布,而是由线性预测变量的S形变换产生的,线性预测变量具有正态分布的系数。这也是Kruschke在本章中也提供了一个较早的示例(带有度量预测变量)(bernoulli参数只是具有正态分布系数的线性函数的S形变换)
user4733 2012年

@ user4733杰克·坦纳(Jack Tanner)正确地认为β是贝努利样品之前的结合物。选择它似乎不仅仅是巧合。是的,您可能正在做Gibbs采样以获取后验分布,但是在层次模型中,涉及多个先验,这可能是您将先验放在超参数(一个先验分布族的参数。它是一个如果您愿意的话,可以使用“先验”;在这种情况下,使用共轭先验可能会很方便。您对本书的某些描述会使我们感到困惑:
Michael R. Chernick 2012年

1
您正在摘录的一些摘录会在我们了解正在发生的事情的能力方面造成差距。您需要描述先验模型和层次结构,以便更好地为我们提供帮助(至少对我而言)>
Michael R. Chernick 2012年

在我要引用的层次模型中添加了一些描述。希望它会有所帮助。
user4733
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.