非信息先验与不当先验之间的区别


10

我想知道这两种先验之间有什么区别:

  • 非信息性的
  • 不当

4
如果您可以在此处提供一些上下文,可能会有所帮助。您已经对这些有什么了解?是否有特定的混淆点?
gung-恢复莫妮卡


@蒂姆,谢谢。我一直在寻找不提供信息的信息,而不是缺乏信息的信息
Bram

Answers:


17

不适当的先验是参数空间上的有限非负度量,使得这样,它们将先验分布的概念,它是参数空间上的概率分布,使得它们可以用几种方式来表征σdπΘ

Θdπ(θ)=+
Θ
Θdπ(θ)=1
  1. 正确的贝叶斯程序的极限集,并非全部是正确的贝叶斯程序;
  2. (可容许性)完全类定理中的常客最优程序,例如Wald的定理;
  3. 频繁的最佳不变估计量(因为根据相应的正确Haar度量,它们可以表示为贝叶斯估计,通常是不正确的);
  4. 从似然函数的形状派生的先验,例如非信息先验(例如,Jeffreys)。

因为它们没有积分到有限的数,所以它们不允许进行概率解释,但是,如果边际可能性为有限,它们仍可用于统计推断因为后验分布就会得到很好的定义。这意味着可以使用与从适当先验中得出的后验分布完全相同的方式来使用它,以得出用于估计的后验量,例如后验均值或后验可信区间。

Θ(θ|x)dπ(θ)<+
(θ|x)dπ(θ)Θ(θ|x)dπ(θ)

警告:贝叶斯推理的一个分支不能很好地应对不正确的先验,即在检验清晰的假设时。确实,这些假设要求构造两个先验分布,一个在正交下,一个在替代下。如果这些先验条件之一不正确,则无法对其进行归一化,并且无法确定由此产生的贝叶斯因子。

在贝叶斯决策理论中,当在损失函数下寻找最优决策程序时,在最小化问题情况下,不合适的先验是有用的 允许一个非平凡的解(即使未定义后验分布)。这种区别的原因是,决策仅取决于乘积,这意味着在先验的变化下,乘性项提供的损失函数是由相同的乘法项划分,大号d θ d π ARG 分钟δL(d,θ)dπ

argmindΘL(d,θ)(θ|x)dπ(θ)
L(d,θ)dπ(θ)ϖ(θ)ϖ(θ)
L(d,θ)dπ(θ)=L(d,θ)ϖ(θ)×ϖ(θ)dπ(θ)

非信息先验是(适当或不正确的)先验分布的类别,它们是根据与似然函数相关的某些信息准则确定的,例如

  1. 拉普拉斯的理由不充分
  2. 杰弗里斯(1939)不变先验;
  3. 最大熵(或MaxEnt)先验(Jaynes,1957);
  4. 最小描述长度先验(Rissanen,1987;Grünwald,2005);
  5. 参考先验(Bernardo,1979,1781; Berger&Bernardo,1992; Bernardo&Sun,2012)
  6. 先验概率匹配(Welsh&Peers,1963; Scricciolo,1999; Datta,2005)

以及其他类别,其中一些在Kass&Wasserman(1995)中进行了描述。“非信息性”这个名字是一个错误的名词,因为没有一个先验是完全非信息性的。见我讨论在这个论坛。或拉里·瓦瑟曼(Larry Wasserman)的腹肌。(无信息的先验通常是不正确的。)


9

严格来说,非信息性先验不是先验分布。这是一个函数,如果我们将其视为分布并应用贝叶斯公式,则会得到一定的后验分布,其目的是尽可能地反映数据中包含的信息,并且仅反映数据中的信息,或获得良好的频率匹配性(即,后可信区间为可信区间大约为可信区间)。95%95%

没有信息的先验通常是“不适当的”。分布具有众所周知的属性:其积分等于1。当非信息先验的积分是无限的时,它被认为是不适当的(因此,在这种情况下,很明显它不是分布)。


3
我认为对“非信息性”的定义在此之前是超级限制性的!
西安

@西安鉴于OP的不足,我认为这个简短的答案很合适。
斯特凡洛朗

@西安这是贝尔纳多的名言(或多或少)。我我同意^^
斯特凡洛朗

1
@西安我还不在家,但例如在这里 参考后代是通过正式使用具有参考先验功能的贝叶斯定理获得的。Benardo说参考先验功能,而不是分配。
斯特凡·洛朗

2
更严重的是,@西安,您的意思是它只限于伯纳德式非信息性先验?是的,也许还有一些。我知道您在这个主题上比我有更多的知识。但是我是贝尔纳多(Bernardo)导向的(并且匹配先验)。
斯特凡洛朗
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.