为什么对MCMC采样器有反对使用Jeffreys或基于熵的先验的建议?


11

Stan的开发人员在其Wiki页面上指出:

我们不喜欢的一些原理:不变性,杰弗里斯,熵

相反,我看到了很多正态分布建议。到目前为止,我使用了不依赖于采样贝叶斯方法,并且是那种高兴地明白了为什么是二项式可能性的不错选择。θ贝塔α=1个2β=1个2


1
通用注释:软件文档并不总是概括关于软件做什么和不做什么的统计参数。我看过的大多数R软件包都是如此,听到Stan的相同我并不感到惊讶。安德鲁·盖尔曼显然是一位多产的作家。
尼克·考克斯

1
进一步的一般性评论:我觉得这种问题不是很令人满意,部分原因是它与特定个人有关。如果现场作者没有在任何地方解释,并且在这里显然不活跃,请向他们发送电子邮件询问。抽象地询问不同方法的相对优点是更令人满意的。有时,如果您发现缺少某些东西(包括编写自己的东西),可以公平地说,您始终可以使用其他软件。保密:从未使用过Stan。
尼克·考克斯

@NickCox我认为匿名化不会使这个问题受益,因为(1)采样软件的上下文很重要(2)我的印象是,拒绝Jeffreys Priors非常不寻常,值得指出知名人士提出了这一主张。(3)我认为在一个问题中引述某人不是对抗性的。
wirrbel

1
安迪(Andy)撰写了“我们不喜欢的一些原理:不变性,杰弗里(Jeffreys),熵”,但看看为什么要看他的
本·古德里奇

1
此外,本文还包含了三位Stan开发人员中有关先验条件的最新思想。
本古德里奇

Answers:


13

当然,这是一个由各种各样的人组成的集合,这些人聚集在一起并撰写Wiki。我总结一下我所了解/理解的一些评论:

  • 基于计算方便性选择先验是不够的。例如,仅因为允许共轭更新而使用Beta(1/2,1/2)并不是一个好主意。当然,一旦您得出结论,它对于所处理的问题类型具有良好的属性,那很好,您也可以做出使实施容易的选择。有很多示例,其中方便的默认选择被证明是有问题的(请参见启用Gibbs采样的Gamna(0.001,0.001))。

  • 使用Stan-与WinBUGS或JAGS不同-(条件)结合先验没有特别的优势。因此,您可能会略微忽略计算方面。并非完全如此,因为具有大量拖尾的先验(或不合适的先验)并且数据不能很好地识别参数,您会遇到问题(这不是Stan特定的问题,但是Stan善于识别这些问题并警告用户而不是幸福地采样掉)。

  • 杰弗里斯(Jeffreys)和其他“低信息”先验有时可能不适当,或者在高维度(不要介意派生它们)和稀疏数据中太难理解。可能只是这些问题经常给作者带来麻烦,以致于他们永远无法接受。一旦您从事某项工作,您就会学到更多并感到自在,因此偶尔会出现观点反转。

  • 在稀疏数据设置中,先验确实很重要,如果您可以指定参数的完全不可信的值是不可信的,那么这会很有帮助。这激发了信息量较弱的先验的想法-并不是真正意义上的充分先验先验,而是那些最支持合理价值的先验。

  • 实际上,您可能想知道,如果我们拥有大量能够很好地识别参数的数据(一个人可能只使用最大似然性),那么为什么一个人会不愿意提供先验信息。当然,有很多原因(避免病理,获得后代的“真实形状”等),但是在“大量数据”的情况下,似乎没有反对弱信息先验的真实理由。

  • 对于许多应用而言,对于逻辑,泊松或Cox回归系数,N(0,1)出人意料的体面,也许有点奇怪。例如,这几乎是许多临床试验中观察到的治疗效果的分布。

感谢您的详细回答。我想我的惊讶并不在于共轭(因为如果我正确理解这一点,Jeffreys先验不需要为共轭先验,它们只需在重新参数化下保持不变)。因此,我将完全理解针对共轭先验的建议。
wirrbel

我认为Jeffreys先验的问题主要在于,它是某个高维先验,可能不是一个适当的先验,并且可能会对您未完全理解的推论产生影响。我认为这主要是与稀疏数据有关的问题,尽管也许有人可以指出一个非稀疏数据的示例,但是会出现一些问题(我不知道有什么问题)。加上Jeffreys的Prior和其他各种“非信息性”选项,实际不得不推导它会带来不便。
比约恩

8

他们没有为此提供任何科学/数学依据。大多数开发人员不使用这种先验,他们更喜欢使用更务实/启发式的先验,例如具有较大差异的正常先验(在某些情况下可能是有益的)。但是,在他们开始研究此主题之后,他们乐于使用基于熵(KL散度)的PC先验,这有点奇怪。

G一个一个0.0010.001


您能否提供盖尔曼所声称的内容丰富的超链接/来源。
吉姆

@Jim Sure,它是论文:projecteuclid.org/euclid.ba/1340371048
之前
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.