为什么用于贝叶斯因子和p值的临界值如此不同?


11

我想了解贝叶斯因子(BF)。我相信它们就像两个假设的似然比。因此,如果BF为5,则意味着H1的可能性是H0的5倍。值3-10表示中度证据,而值> 10表示有力证据。

但是,对于P值,传统上将0.05作为截止值。在此P值下,H1 / H0似然比应约为95/5或19。

那么,为什么BF的截止值> 3,而P值的截止值> 19?这些值也不是很接近。


2
我跟他说:“如果BF不舒服,这意味着^ h 15倍更有可能比H ^ 0 ”。贝叶斯因子可能是边际似然比,但不是概率比或比值比,因此必须与之前的值结合才能使用5H15H0
亨利

如果我们没有任何特定的先验信息,那么关于BF的含义我们能说什么?
rnso

当然,即使说没有任何特定的先验信息,也拥有“一些”先验信息。也就是说,在这种情况下,根据无差异原则为每个假设分配相等的概率是合理的。这是所谓的非信息先验的一个简单例子(公认的误称)。
dnqxt

在这种情况下,BF为5是否表示一个假设的可能性高5倍?
rnso

是的,但是这个问题比看起来的要复杂得多,并且涉及统计中的模型选择领域。您已被警告:))
dnqxt

Answers:


10

一些东西:

BF为您提供了支持该假设的证据,而常识性假设检验则为您提供了针对(无效)假设的证据。所以有点像“苹果到桔子”。

尽管在解释上有所不同,但这两个过程可能导致不同的决定。例如,BF可能会拒绝,而频繁假设检验则不会,或者反之亦然。这个问题通常被称为Jeffreys-Lindley悖论。这个网站上有很多关于这个的帖子;见例如这里这里

“在此P值下,H1 / H0可能性应该为95/5或19。” 不,这不是真的,因为,大致pÿH1个1个-pÿH0。至少要计算一个p值并进行一个频繁检验,就不需要您对pÿH1个有任何了解。同样,p值通常是密度/ pmfs的积分/总和,而BF不在数据样本空间上积分。


2
泰勒跟它的证据阈值针对一种假设()不能直接相比,证据阈值对于另一个假说(ħ 1),也不能约。当您停止相信无效效果时,就不必与开始相信替代方法时有关。这就是为什么p值不应解释为1 相信H 1)的原因H0H1个p1个-对H的信念1个
Frans Rodenburg

1
也许这可以澄清:en.wikipedia.org/wiki/Misunderstandings_of_p-values的频率论 -值是不是证据措施任何东西。p
弗朗斯·罗登堡

2
抱歉,最后一个评论:之所以不能将其视为支持证据,是因为如果H 0为真,就有机会观察到如此大的效应大小。如果H 0确实为真,则p值应该是一致随机的,因此其值对H 1的概率没有意义。解释的这种微妙之处是p值被滥用的原因之一。H1个 H0H0pH1个p
弗朗斯·罗登堡

1
@benxyzzy:值的分布仅在零假设下是均匀的,而在p值严重偏向零的情况下则不然。p
西安

1
@benxyzzy要补充一点:使用值的要点是在零假设下它是均匀随机的,因此,如果您得到一个很小的p值,则暗示它可能不是均匀随机的,因此可能为空假设是不正确的。pp
JiK

8

贝叶斯因子01可以相等的权重下变成一个概率为

P01=1个1个+1个01
但这不能使它们p值可比,因为

  1. P01是参数空间中的概率,而不是采样空间中的概率
  2. 它的值和范围依赖于在先测量的选择,它们是相对于由此而不是绝对的(和泰勒的提及的的林德利-杰弗里斯悖论是合适在此阶段
  3. 01P01包含的复杂性(奥卡姆剃刀)的罚款通过在参数空间中集成了

如果要考虑贝叶斯相当于p -值时,后验预测 p -值(孟,1994)应进行调查

01=P01X01X肥胖
,其中X肥胖表示观察和X是从后预测分布式
XΘFX|θπθ|X肥胖dθ
但这并不意味着拒绝和相同的“默认”标准的意义应适用于该对象。


使用您的公式,BF的P为3和10分别为0.75和0.91。我们为什么要接受这些作为中等证据,因为对于P值,我们将临界值保持在0.95?
rnso

为什么在此框架中有意义?还是全部?确定大号何时足够大取决于实用程序功能。0.95
西安

该公式看起来更简单P = B/(B+1)
rnso

2

您的某些困惑可能是由于p值为0.05的事实直接取了95/5,这是您在做什么?我不认为这是正确的。例如,t检验的p值反映了获得均值之间观察到的差异的机会,或者如果零假设实际上是真实的,则该差异可能会产生更大的差异。如果ap值为0.02,则说“啊”,只有2%的机会得到这样的差异,或者如果null为true,则差异更大。这似乎非常不可能,所以我建议null不正确!这些数字与进入贝叶斯因子的东西不同,贝叶斯因子是给每个竞争假设的后验概率之比。这些后验概率的计算方式与p值不同,

附带说明一下,我建议强烈建议不要将不同的BF值视为具有特定意义。这些分配是完全任意的,就像.05的显着性水平一样。如果人们开始相信只有特定的数字值得考虑,贝叶斯因素(Bayes Factors)也会很容易发生诸如p-hacking之类的问题。尝试了解它们的含义(如相对概率),并根据自己的判断确定是否找到有说服力的BF数字。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.