模糊的先验与非信息先验是否相同?


27

这是关于术语的问题。“模糊的先验”与非信息先验是否相同,还是两者之间有区别?我的印象是,它们是相同的(从模糊和非信息性的角度来看),但是我不确定。


1
依稀:是的。非情报性:号
红衣主教

Answers:


18

Gelman等。(2003)说:

长期以来,人们一直希望可以保证先验分布在后验分布中发挥最小的作用。这种分布有时被称为“参考先验分布”,并且先验密度被描述为模糊,平坦或无信息。[从原文中强调]

基于我对Gelman等人对Jeffreys先验的讨论的阅读。(2003年,第62ff页),关于是否存在真正的非信息性先验尚无共识,并且足够模糊/平坦/分散的先验就足够了。

他们提出的一些观点:

  1. 任何先验都包括信息,包括指出没有信息的先验。
    • 例如,如果我们知道我们对所讨论的参数一无所知,那么我们就知道一些。
  2. 在大多数应用的上下文中,当足够模糊的先验条件满足时,真正没有信息的先验条件并没有明显的优势,而且在许多情况下,使用模糊的共轭先验参数化有很多优势,例如找到合适的先验条件。
  3. 杰弗里斯(Jeffreys)的原理对于构造使单变量模型中的费舍尔信息内容最小化的先验方法可能有用,但是对于多变量情况没有类似物
  4. 比较模型时,Jeffrey的先验会随着可能性的分布而变化,因此先验也必须改变
  5. 关于是否甚至存在非信息性的先验,通常存在很多争论(由于为1,有关此讨论的历史,请参见Gelman等人在第66页上的讨论和参考)。

请注意,这是社区Wiki-基本理论在我的理解范围内,我希望为这一回答做出贡献。

Gelman等。2003年贝叶斯数据分析,查普曼和霍尔/ CRC


1
盖尔曼本人已经超越了“非情报性 ”的先例,例如参见stat.columbia.edu/~cook/movabletype/archives/2007/07/…,以及我在回答中引用的论文以及他的其他著作。这种态度似乎在应用统计学家中越来越普遍。
JMS

@JMS Gelman等 等 2003年提出了这一点,而我尝试对其进行总结,他们似乎考虑将非信息性先验用于背景/理论/启发式目的
David LeBauer 2011年

是的,有关贝叶斯统计的教科书当然不能忽略它们。我只是为了补充一点,在应用统计此后一直从这些传统的选择搬走,但工作仍在继续的“客观贝叶斯”的趋势
JMS

我认为人们在描述先验时倾向于以两种方式使用信息:非正式的意义和信息理论的意义。因此,从信息理论的角度来看,您可以优先考虑包含尽可能少信息的最大熵。使用此分布,您(可能)表示“您对参数一无所知”,这在非正式的意义上可能是非常
有益的

9

绝对不是,尽管它们经常互换使用。参数的模糊先验(相对不为人所知,相对于其他值而言并不真正偏爱某些值)实际上可以在某些其他变换f θ 上诱导出非常有益的先验。这至少是杰弗里斯(Jeffreys)先前动机的一部分,后者最初被构造为尽可能不提供信息。θf(θ)

模糊的先验还可以对您的模型做一些相当痛苦的事情。现已经典例子是使用 ε →交通0在层次模型上方差分量先验。InverseGamma(ϵ,ϵ)ϵ0

在这种情况下,不适当的先验限制会导致不正确的后验。一种流行的选择是将really 得很小,这导致在R +上看起来几乎一致的先验。但这也导致后验几乎不正确,并且模型拟合和推论遭受损失。有关完整说明的信息,请参见Gelman 先验分布,以获取层次模型中的方差参数ϵR+

编辑:@csgillespie(正确!)指出,我尚未完全回答您的问题。在我看来,非信息性先验是模糊的,因为它并不特别偏爱参数空间中的一个区域而不是另一个,但是这样做不应引起其他参数的先验信息。因此,无信息的先验是模糊的,但是模糊的先验并不一定是无信息的。贝叶斯变量选择就是其中一个例子。变量包含概率的“模糊”先验实际上可以对模型中包含的变量总数产生相当丰富的先验信息!

在我看来,寻找真正无信息的先验是不正确的(尽管很多人会不同意)。最好使用所谓的“弱”信息先验(我想,从某种意义上讲,它通常是模糊的)。真的,我们是否经常知道什么有关问题的参数?


您的回答非常好,但是您实际上没有说明什么是“非信息先验”以及它与“模糊先验”的区别;)
csgillespie 2011年

@cgillespie:您是对的,编辑:)
JMS

紧跟着您的最后一段,并证明了搜索的古怪性质:如果我们知道对所讨论的参数一无所知,那么我们对此也会有所了解。
David LeBauer 2011年

相当!具有讽刺意味的是,许多人花了很多精力在优先考虑的选择上,在降低可能性之前不会三思而后行。通常,错误指定的可能性更容易引起麻烦。但这完全是另一个问题……
JMS

5

Lambert等人(2005)提出了一个问题:“ Vague是Vague吗?使用WinBUGS在MCMC中使用vague先验分布的影响的模拟研究 ”。他们写道:“我们不主张使用非信息性先验分布,因为我们认为所有先验都有助于提供某些信息”。我倾向于同意,但我绝对不是贝叶斯统计专家。


2
这与我的主观先验信念一致,即不存在非信息性先验。
一站式

@onestop,请考虑对我的CW答案做出贡献
David LeBauer 2011年

IG(ϵ,ϵ)ϵ0

3

我怀疑“模糊的先验”是指一种已知的先验,该先验已知是对有关参数真实值的少量但非零知识的编码,而“非信息先验”将用于表示完全无知关于该参数的值。也许可以用来表明分析不是完全客观的。

例如,对于非信息先验是统一的参数,非常宽泛的高斯可能是模糊的先验。高斯模型在兴趣范围上几乎是持平的,但是仍然会偏爱某个特定值,而不是其他任何值(但这可能使问题在数学上更易于处理)。


这就产生了一个问题,即制服真的是非情报性的吗?无信息制服的最大值和最小值是多少?先验会在转变为另一种规模后成为非信息性的吗?
David LeBauer 2011年

1
一致的先验不一定非必要,反之亦然,这取决于问题的性质。我认为,提供最少信息的先验的想法通常是更现实的,使用MAXENT和转换组来决定先验分布,该先验分布传达的信息量最少且已知约束(例如,先验应不变于缩放)。对于许多问题,不合适的先验效果很好,因此不一定需要定义明确的最小值和最大值。
Dikran有袋动物2011年

2

非信息先验具有不同的形式。这些形式包括模糊先验和不当先验。因此模糊的先验是非信息先验的一部分。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.