我想了解贝叶斯因子(BF)。我相信它们就像两个假设的似然比。因此,如果BF为5,则意味着H1的可能性是H0的5倍。值3-10表示中度证据,而值> 10表示有力证据。
但是,对于P值,传统上将0.05作为截止值。在此P值下,H1 / H0似然比应约为95/5或19。
那么,为什么BF的截止值> 3,而P值的截止值> 19?这些值也不是很接近。
我想了解贝叶斯因子(BF)。我相信它们就像两个假设的似然比。因此,如果BF为5,则意味着H1的可能性是H0的5倍。值3-10表示中度证据,而值> 10表示有力证据。
但是,对于P值,传统上将0.05作为截止值。在此P值下,H1 / H0似然比应约为95/5或19。
那么,为什么BF的截止值> 3,而P值的截止值> 19?这些值也不是很接近。
Answers:
一些东西:
BF为您提供了支持该假设的证据,而常识性假设检验则为您提供了针对(无效)假设的证据。所以有点像“苹果到桔子”。
尽管在解释上有所不同,但这两个过程可能导致不同的决定。例如,BF可能会拒绝,而频繁假设检验则不会,或者反之亦然。这个问题通常被称为Jeffreys-Lindley悖论。这个网站上有很多关于这个的帖子;见例如这里和这里。
“在此P值下,H1 / H0可能性应该为95/5或19。” 不,这不是真的,因为,大致。至少要计算一个p值并进行一个频繁检验,就不需要您对有任何了解。同样,p值通常是密度/ pmfs的积分/总和,而BF不在数据样本空间上积分。
的贝叶斯因子可以相等的权重下变成一个概率为
如果要考虑贝叶斯相当于 -值时,后验预测 -值(孟,1994)应进行调查
P = B/(B+1)
您的某些困惑可能是由于p值为0.05的事实直接取了95/5,这是您在做什么?我不认为这是正确的。例如,t检验的p值反映了获得均值之间观察到的差异的机会,或者如果零假设实际上是真实的,则该差异可能会产生更大的差异。如果ap值为0.02,则说“啊”,只有2%的机会得到这样的差异,或者如果null为true,则差异更大。这似乎非常不可能,所以我建议null不正确!这些数字与进入贝叶斯因子的东西不同,贝叶斯因子是给每个竞争假设的后验概率之比。这些后验概率的计算方式与p值不同,
附带说明一下,我建议强烈建议不要将不同的BF值视为具有特定意义。这些分配是完全任意的,就像.05的显着性水平一样。如果人们开始相信只有特定的数字值得考虑,贝叶斯因素(Bayes Factors)也会很容易发生诸如p-hacking之类的问题。尝试了解它们的含义(如相对概率),并根据自己的判断确定是否找到有说服力的BF数字。