首先适合贝叶斯模型,然后开始削弱先验可以吗?


10

在进行常客统计时,一长串重大的禁忌之举,例如在决定收​​集更多数据之前先查看统计测试的结果。我通常想知道贝叶斯统计中涉及的方法是否存在类似的不行清单,尤其是以下内容是否是其中之一。

我最近意识到,对于我一直在拟合的某些模型,我的过程一直是首先将模型与信息丰富的先验条件拟合,以查看其是否起作用或爆炸,然后将先验条件削弱为缺乏信息或弱信息化,调整模型。

我这样做的动机确实与我用JAGS / Stan编写这些模型有关,在我看来,我一直将其视为编程任务,而不是统计任务。因此,我进行了首次运行,通过使用先验信息使它能够快速收敛,从而更容易发现我编写的模型中的错误。然后,在调试模型后,我用无信息或信息量较弱的先验条件对其进行了重新拟合。

我的问题是我是否在此过程中违反了一些严肃的规定。例如,为了使我的推论有效,并且避免利用研究人员的自由度,开始拟合任何模型之前,我是否需要承诺先验先验?


4
除了幽默(我希望),这是我写的首诗。(是的,我知道这不是颂歌)
彼得·弗洛姆

@PeterFlom,哦,这是不祥的。
2012年

Answers:


9

主观贝叶斯主义者可能会不同意,但是从我的角度来看,先验只是模型的一部分,就像可能性一样。响应模型行为而改变先验并不比改变您的似然函数(例如尝试不同的误差分布或不同的模型公式)更好或更糟。

如果让您继续钓鱼,可能会很危险,但是其他选择可能会更糟。例如,在您提到的情况下,您的模型崩溃了,得到了无意义的系数,那么您别无选择,只能重试。

另外,您可以采取一些步骤来最大程度地减少钓鱼探险的危险:

  • 预先确定您要在最终分析中使用的优先级
  • 在发布或描述有关整个过程的分析时保持领先
  • 尽可能使用模拟数据和/或保留数据以进行最终分析。这样,您就不会污染太多的分析。

4

如果您尝试先验并根据手边数据的性能选择一个,则它不再是“先验”。它不仅取决于数据(如经验贝叶斯分析中的数据),而且还取决于您想要查看的内容(这更糟)。最后,您确实使用了贝叶斯工具,但这不能称为贝叶斯分析。


1
据我了解OP,他没有使用先验结果,而是决定先验结果会给他带来更好的结果。他正在使用人工模型来查看模型的正确编码,然后切换到实际模型进行分析。也许,如果他在第一步中也使用了综合数据,然后又在第二步中同时使用了他的实际数据和实际数据,那会更容易接受吗?
韦恩2012年

3

我认为您在这种情况下还可以,原因有以下三个:

  1. 您实际上并没有根据结果调整先验条件。如果您说“我使用XYZ先验,并根据收敛速度和DIC结果,然后通过ABC修改我的先验”,那么我会说您要执行不,但在这种情况下,听起来您确实没有这样做。

  2. 在贝叶斯上下文中,先验是明确的。因此,您可能会不正确地调整先验,但最终的先验将始终可见,以供其他人检查,以质疑您为什么拥有这些特定先验。也许我在这里很幼稚,因为很容易瞥到类似先验的东西,然后说“嗯,看起来很合理”,仅仅是因为有人提出来了,但是...

  3. 我认为您正在做的事情与Gelman(和其他人)的建议有关,这些建议需要逐步构建JAGS模型,首先使用合成数据,然后使用真实数据,以确保没有规格错误。 。这并不是频繁主义者方法学中的真正因素,也不是实验方法学。

再说一次,我仍然在自己学习这些东西。

PS:当您最初说要使其与“信息先验”快速收敛时,您是说实际上是由眼前问题所激发的信息先验,还是只是出于任意原因强烈推动/限制后验以加速“收敛”的先验。到某个任意点?如果是第一种情况,那么为什么要离开这些(积极的)先验呢?


1

我认为这可能与贝叶斯学派无关。杰弗里斯想使用非信息先验。Lindley可能希望您使用信息先验。贝叶斯经验主义者会要求您让数据影响先验。但是我认为,尽管每所学校对优先级的选择提出了不同的建议,但它们都具有一种并不意味着您可以采用优先级并不断对其进行调整直到获得所需结果的方法。这肯定就像查看数据并争先恐后地收集数据并进行测试,直到您对答案应该是什么先入为主。

频繁或贝叶斯都没关系,我认为没有人会希望您使用(或按摩)数据的把戏。也许这是大家都同意的事情,而彼得的滑稽诗确实很恰当。


1

我会说不,您不必致力于特定的先验。通常,在进行任何贝叶斯数据分析时,您应该对模型对先验的敏感性进行分析。这将包括尝试其他各种先验方法,以查看结果如何。这可能表明应该使用更好或更强健的先验。

两个明显的“不可以”是:过度使用先验值以获得更好的拟合度,导致过度拟合,并更改模型的其他参数以获得更好的拟合度。作为第一个例子:更改均值的初始先验,使其更接近样本均值。第二点:更改回归中的解释变量/特征以获得更好的拟合度。这在任何版本的回归中都是一个问题,并且基本上使您的自由度无效。


+1表示敏感度分析。您应该知道您的结果多少取决于所使用的先验条件
Manoel Galdino
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.