杰弗里斯先验为何有用?


Answers:


30

让我完成Zen的回答。我不太喜欢“代表无知”的概念。重要的不是Jeffreys在前,而是Jeffreys在。后验的目的是尽可能地反映有关数据带来的参数的信息。接下来的两点自然需要不变性。考虑例如具有未知比例参数和比值参数的二项式模型。θψ=θ1θ

  1. 上的Jeffreys后验尽可能地反映了数据带来的信息。和之间存在一一对应的关系。然后,将上的Jeffreys后验变换为上的后验(通过通常的变量变化公式)应产生一个分布,该分布尽可能地反映有关的信息。因此,这种分布应该是的Jeffreys后验。这是不变性属性。θθθψθψψψ

  2. 得出统计分析结论的重点是科学传播。假设您将Jeffreys放在交给一位科学同事。但是他/她对而不是感兴趣。这样,不变性就不成问题:他/她只需要应用变量变化公式即可。θψθ


嗯,这使事情变得有些清晰。但是,出于直觉上的理由,为什么赔率参数的后验应该与比例参数的后验相同?对我来说,这似乎很不自然。
tskuzzy 2012年

不一样!一个由变量变化公式引起。两个参数之间存在一一对应的关系。然后,其中一个参数的后验分布应引起另一个参数的后验分布。
斯特凡纳·洛朗

2
(+1)斯特凡。当OP说“ ...应该相同...”时,OP似乎仍然感到困惑。这两个后代不是“相同的”,发生的事是,例如,在史蒂芬(Stéphane)的示例中,您有 ; 如果您没有使用默认(计算的)先验来实现这种一致性,那么您的先验就有点麻烦了。P{1/3θ2/3X=x}=P{1/2ψ2X=x}
2012年

1
我认为这篇文章缺少的是,当数据中有大量有关参数的信息时,所使用的特定先验并不重要。例如,一个二项式比例,无论我们使用统一的,杰弗里式的还是霍尔丹的先验,除非后验非常宽泛,否则差别很小。在这种情况下,关于哪个先验是“正确的”有点学术上的争论,因为无论如何都无法得出有意义的结论。非信息性先验的真正价值是多方面的,但是这个问题尚未解决-杰弗里斯先验在这里很糟糕。
概率

3
该理论是不完整的,并且取决于参数排序,紧凑区域的选择和似然函数。因此,它没有遵循例如似然原理。而且,很难应用于非独立数据。此外,贝尔纳多的理论仅对一维参数问题是完整的。虽然这可能是当前可用的最佳方法。Jaynes的转型团队方法是一个很好的竞争对手。
概率

41

假设您和朋友正在使用普通模型分析同一组数据。您采用均值和方差作为参数的普通模型的常规参数化设置,但是您的朋友更喜欢使用变异系数和精度作为参数对普通模型进行参数化(完全“合法”)。如果您俩都使用Jeffreys的先验,则您的后验分布将是您朋友的后验分布,正确地从他的参数化转换为您的参数化。从这个意义上说,杰弗里斯的先验是“不变的”

(顺便说一句,“不变”是一个可怕的词;我们真正的意思是,它在张量微积分/微分几何的相同意义上是“协变”的,但是,当然,该术语已经具有明确的概率意义,因此我们不能使用它。)

为什么需要这种一致性属性?因为,如果杰弗里斯(Jeffreys)的先验有机会以绝对意义表示对参数值的无知(实际上,它不是,但由于其他原因与“不变性”无关),并且相对于特定的参数化也不会无知对于模型,必须如此,无论我们随意选择从哪个参数开始,变换后我们的后代都应该“匹配”。

杰弗里斯本人在构造他的先验时经常违反此“不变性”属性。

有对此及相关学科的一些有趣的讨论。


1
+1:好答案。但是,为什么杰弗里氏先验不代表对参数值的无知呢?
尼尔·G

4
因为它甚至没有分布。宣称分布反映了无知是自相矛盾的。分布始终反映信息。
斯特凡·洛朗


@StéphaneLaurent:即使是完全无知,也必须有一些信念。无论您的后验是多少,无论数据引起什么可能性,都是您认为自己处于这种无知状态。在确定信念时必须遵循的直观原则是,在标签更改(包括重新参数化)的情况下,它应该是不变的。我不确定,但是我认为仅凭原则(在所有可能的解释中-最大熵,不变的重新参数化等)总是可以决定信念。
Neil G

因此,当人们说“分配反映了无知”时,意味着分配符合这一原理。
Neil G

12

在Zen的一个很好的答案中加上一些引述:根据Jaynes的说法,Jeffreys先验是变换组原理的一个示例,该变换组是基于冷漠原理的:

该原理的实质是:(1)我们认识到概率分配是描述知识的某种状态的一种手段。(2)如果可用证据没有理由比或多或少地考虑命题,那么我们唯一可以描述知识状态的诚实方法就是为它们分配相等的概率:。在某种意义上,任何其他过程都是不一致的,因为仅通过交换标签我们就可以产生一个新的问题,即我们的知识状态相同,但是我们分配的概率不同……A1A2p1=p2(1,2)

现在,回答您的问题:“为什么不希望先验在变量变化下发生变化?”

根据Jaynes的说法,参数化是另一种任意标记,并且“不能仅仅通过交换标记就产生一个新问题,即我们的知识状态相同,但我们分配的概率不同。 ”


2
Jaynes对我来说似乎有些神秘。
斯特凡·洛朗


2
西安(Xian)收到赞扬贾恩斯( Jaynes)的邮件:ceremade.dauphine.fr/~xian/critic.html可惜的是,如果您不阅读法语,这封邮件既令人恐惧又有趣。作者似乎对贝叶斯统计数据考虑得太多了,就变得发疯了;)
StéphaneLaurent 2012年

1
@StéphaneLaurent:现在阅读。这是绝对正确的:“第508页肯定了大多数实验的不可重复性”,第512页是“寻求最佳的惯常做法”的个人套间吗?在常人看来,这种特殊的作法,评论“ choixBayésien”,《不道德的行为》,《不动产》,《不和谐的基础》(第517-518页)?倒入颂扬qu'uneprobabilitén'est jamais une andfréncence!”
Neil G

1
另外:“《最高王子制宪章》已确立为基本法令,并适当地充实了法院的裁决,并有可能使事前证明其具有根据可诉性。 Quéilpermet ensuite d'unifierThéoriede l'Information,MécaniqueStatistique,Thermodynamique…”也描述了我的立场。但是,与作家不同,我没有兴趣花时间说服他人接受我认为如此自然的事情。
Neil G

4

尽管经常引起人们的兴趣,但杰弗里的先验可能只是完全没有用,例如当它们导致不正确的后验时:例如,简单的两成分高斯混合就是这种情况。 ,所有参数均未知。在这种情况下,无论有多少观察可用,都不存在杰弗里斯先验的后验。(该证据可在我与克拉拉·格拉齐安(Clara Grazian)撰写的最新论文中找到。)

pN(μ0,σ02)+(1p)N(μ1,σ12)

-1

杰弗里斯先验是无用的。这是因为:

  1. 它只是指定分布的形式;它不会告诉您其参数应该是什么。
  2. 您永远不会完全无知-关于参数的知识总有一些(例如,通常不能为无穷大)。通过定义先验分布将其用于推理。不要说自己一无所知对自己说谎。
  3. “转换中的不变性”不是理想的属性。您的可能性在变换下会发生变化(例如,通过雅可比矩阵)。这不会产生“新问题” 的步伐杰恩斯。为什么先决条件不应该被相同对待?

只是不要使用它。


1
h?可能性不是密度,在重新参数化的情况下不会改变
innisfree
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.