我认为,作为统计学家,最大的问题之一是,您必须问自己:您是否相信或想要坚持可能性原则。如果您不相信似然原理,那么我认为统计学的常识范式可能非常强大,但是,如果您确实相信似然原理,那么(我相信)您肯定会在或不违反它。
如果您不熟悉它,似然原理告诉我们以下内容:
似然原理:在观察到某些数据后对进行推断或决策时,所有相关实验信息均包含在似然函数中:
其中对应于观察到的数据,因此是固定的。θx
ℓ(θ;x)=p(x|θ)
x
此外,如果和是两个采样点,使得与成比例,则,存在一个常数使得xyℓ(θ;x)ℓ(θ;y)C(x,y)
ℓ(θ;x)=C(x,y)ℓ(θ;y)for all θ,
那么从和得出的结论应该是相同的。\xy
请注意,上述常数对于不同的对可能有所不同,但不依赖。C(x,y)(x,y)C(x,y)θ
在的特殊情况下,似然原理指出,如果两个采样点产生相同的似然函数,则它们包含有关的相同信息。但是,可能性原则则更进一步。它指出,即使两个采样点仅具有成比例的似然,它们也包含有关等效信息。θ θC(x,y)=1θθ
现在,贝叶斯统计的吸引之一是,在适当的先验条件下,贝叶斯范式永远不会违反似然性原理。但是,在非常简单的场景中,频繁使用者范例将违反似然性原理。
这是一个基于假设检验的非常简单的示例。考虑以下:
考虑一个进行了12次Bernoulli试验并观察到3次成功的实验。根据停止规则,我们可以将数据表征如下:
- 二项式分布:和数据:X = 3X|θ∼Bin(n=12,θ)x=3
- 负二项式分布:
和数据:ÿ = 12Y|θ∼NegBin(k=3,θ)y=12
因此,我们将获得以下似然函数:
,这意味着
,因此,根据似然原理,我们应该从任一可能性中获得关于的相同推论。
ℓ1(θ;x=3)ℓ2(θ;y=12)=(123)θ3(1−θ)9=(112)θ3(1−θ)9
ℓ1(θ;x)=C(x,y)ℓ2(θ,y)
θ
现在,想像一下从范式检验以下假设
Ho:θ≥12versusHa:θ<12
对于二项式模型,我们具有以下内容:
p-value=P(X≤3|θ=12)=(120)(12)12+(121)(12)12+(122)(12)12+(123)(12)12=0.0723
请注意但其他术语可以不满足似然性原则。(123)(12)12=ℓ1(12;x=3)
对于负二项式模型,我们具有以下内容:
p-value=P(Y≥12|θ12)=(112)(12)12+(122)(12)12+(132)(12)12+...=0.0375
从上面的p值计算中可以看出,在二项式模型中,我们将拒绝拒绝但是在使用负二项式模型中,我们将拒绝。因此,即使仍然存在p值,并且基于这些p值的决策也不一致。这种p值参数是贝叶斯人经常使用的反对使用频繁p值的参数。HoHoℓ1(θ;x)∝ℓ2(θ;y)
现在考虑再次测试以下假设,但来自贝叶斯范式
Ho:θ≥12versusHa:θ<12
对于二项式模型,我们具有以下内容:
P(θ≥12|x)=∫11/2π(θ|x)dx=∫11/2θ3(1−θ)9π(θ)dθ/∫10θ3(1−θ)9π(θ)dθ
同样,对于负二项式模型,我们具有以下内容:
P(θ≥12|y)=∫11/2π(θ|x)dx=∫11/2θ3(1−θ)9π(θ)dθ/∫10θ3(1−θ)9π(θ)dθ
现在使用贝叶斯决策规则,如果(或其他一些阈值),则选择,重复类似的操作。HoP(θ≥12|x)>12y
但是,这样我们得出相同的结论,因此该方法满足似然原理。P(θ≥12|x)=P(θ≥12|y)
因此,总结一下我的观点,如果您不关心似然原理,那么经常出入是很棒的!(如果您不能告诉我,我是贝叶斯:))