如何确定先验概率分布?有没有应该使用的经验法则或技巧?


9

尽管我想认为自己对贝叶斯统计分析和决策中的先验信息概念有很好的了解,但我经常难以理解它的应用。我想到了几种情况,这些都是我奋斗的例证,而且我认为到目前为止,我所读过的贝叶斯统计教科书并未适当地解决这些问题:

假设我几年前进行了一项调查,其中说68%的人会对购买ACME产品感兴趣。我决定再次进行调查。虽然我将使用与上次相同的样本量(例如n = 400),但此后人们的看法可能已经改变。但是,如果我使用beta分布作为先验,在400位受访者中有272位回答“是”,那么我将对几年前进行的调查和现在正在进行的调查给予同等的重视。是否有经验法则来确定我想基于数据存在数年之久的更大不确定性?我知道我可以将优先级从272/400降低到136/200,但这感觉非常武断,我想知道在文献中是否存在某种形式的辩护,

再举一个例子,假设我们要进行一项临床试验。在启动试验之前,我们进行了一些辅助研究,可以用作以前的信息,包括专家意见,先前临床试验的结果(具有不同的相关性),其他基本的科学事实等。如何结合这些信息范围(其中有些是非量化的)到先前的概率分布?只是为了决定选择哪个家庭并使其充分分散以确保其不被数据淹没而已,还是为了建立一个相当有用的先验分布而做了大量工作?


Answers:


4

您的想法是处理您400次尝试中的272次成功的先验信息,这一点确实具有相当可靠的贝叶斯论证。

正如您所认识到的那样,您要解决的问题是估算伯努利实验的成功概率。Beta分布是相应的“共轭先验”。此类共轭先验具有“虚拟样本解释”:θ

贝塔之前是 这可以被解释为包含大小的样品中的信息Ñ_=α0+β0-2(松散所以作为ñ_不需要是整数当然)与α0-1成功: πθ=Γ

πθ=Γα0+β0Γα0Γβ0θα0-1个1个-θβ0-1个
ñ_=α0+β0-2ñ_α0-1个 因此,如果你把α0+β0-2=400α0-1=272,这对应于现有参数α0=273β0=129
πθ=Γα0+β0Γα0Γβ0θα0-1个1个-θñ_-α0-1个
α0+β0-2=400α0-1个=272α0=273β0=129α0=137β0=65岁
μ=αα+βσ2=αβα+β2α+β+1个
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

但增加现有方差

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

如预期的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.