没有什么比回答一个真正的老问题了,但是这里...
p值几乎是有效的假设检验。这是从杰恩斯(Jaynes)2003年的概率论书(重复实验:概率和频率)中摘录的经过改编的摘录。假设我们要检验一个零假设。我们有数据和以前的信息。假设有一些未指定的假设,我们将针对其进行检验。对的后验优势比为: D I H A H 0 H A H 0H0DIHAH0HAH0
P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)
现在,右侧的第一项与数据无关,因此数据只能通过第二项影响结果。现在,我们总是可以发明一个替代假设,使得一个“完美拟合”假设。因此,我们可以使用来衡量数据对空值的支持情况。没有其他假设可以证明数据在的支持程度可以大于。我们还可以限制替代项的类别,变化是将替换为该类别中的最大可能性(包括归一化常数)。如果 P (D | H A I )= 1 1HAP(D|HAI)=1 H011P(D|H0I)H0 1P(D|H0I)H0HAt(D)>t0t(D)Dt(D)1P(D|H0I)1P(D|H0I)开始变得太小,然后我们就开始怀疑空值,因为和之间的替代项数量增加了(包括一些先验概率不可忽略的)。但这几乎是用p值完成的工作,但是有一个例外:我们不为某些统计和统计的某些“坏”区域计算的概率。我们计算的概率是我们实际拥有的信息,而不是。H0HAt(D)>t0t(D)Dt(D)
人们使用p值的另一个原因是,它们通常等于“适当的”假设检验,但可能更易于计算。我们可以通过一个非常简单的示例来证明这一点,该示例以已知方差测试正常均值。我们有数据,其模型为(先前信息)。我们要测试。经过一些计算,我们得到:X 我〜Ñ ö ř 米一升(μ ,σ 2)我ħ 0:μ = μ 0D≡{x1,…,xN}xi∼Normal(μ,σ2)IH0:μ=μ0
P(D|H0I)=(2πσ2)−N2exp(−N[s2+(x¯¯¯−μ0)2]2σ2)
其中和。这表明当时将达到的最大值。最大值为:s2=1x¯¯¯=1N∑Ni=1xiP(d|H ^0我)μ0=‾ Xs2=1N∑Ni=1(xi−x¯¯¯)2P(D|H0I)μ0=x¯¯¯
P(D|HAI)=(2πσ2)−N2exp(−Ns22σ2)
因此,我们将两者的比率取为:
P(D|HAI)P(D|H0I)=(2πσ2)−N2exp(−Ns22σ2)(2πσ2)−N2exp(−Ns2+N(x¯¯¯−μ0)22σ2)=exp(z22)
其中是“ Z统计量”。大值 相对于有关数据最有力支持的正常均值的假设,对原假设提出了疑问。我们还可以看到是所需数据的唯一部分,因此对于测试来说是足够的统计信息。z=N−−√x¯¯¯−μ0σ|z|x¯¯¯
针对此问题的p值方法几乎相同,但相反。我们从足够的统计量,然后计算其抽样分布,这很容易显示为 -我使用大写字母将随机变量与观察值区分开。现在我们需要找到一个对原假设产生怀疑的区域:很容易看出这些区域是大。因此,我们可以计算的概率x¯¯¯X¯¯¯¯∼Normal(μ,σ2N)X¯¯¯¯x¯¯¯|X¯¯¯¯−μ0||X¯¯¯¯−μ0|≥|x¯¯¯−μ0|用来衡量观察到的数据与原假设之间的距离。和以前一样,这是一个简单的计算,我们得到:
p-value=P(|X¯¯¯¯−μ0|≥|x¯¯¯−μ0||H0)
=1−P[−N−−√|x¯¯¯−μ0|σ≤N−−√X¯¯¯¯−μ0σ≤N−−√|x¯¯¯−μ0|σ|H0]
=1−P(−|z|≤Z≤|z||H0)=2[1−Φ(|z|)]
现在,我们可以看到p值是的单调递减函数。,这意味着我们基本上得到与“正确”假设检验相同的答案。当p值低于某个阈值时拒绝则与后验赔率高于某个阈值时拒绝相同。但是,请注意,在进行适当的测试时,我们必须定义替代项的类别,并且必须使该类别的可能性最大化。对于p值,我们必须找到一个统计量,并计算其抽样分布,并根据观察值进行评估。从某种意义上说,选择一项统计信息等效于定义您正在考虑的替代假设。|z|
尽管在此示例中它们都很容易做到,但是在更复杂的情况下它们并不总是那么容易。在某些情况下,可能更容易选择要使用的正确统计信息并计算其抽样分布。在其他情况下,定义替代项的类别并在该类别上最大化可能会更容易。
这个简单的示例说明了大量基于p值的检验,这仅仅是因为如此多的假设检验属于“近似正常”变量。它也为您的硬币问题提供了一个近似的答案(通过使用二项式的正态近似)。它还表明,在这种情况下,p值不会使您误入歧途,至少就检验单个假设而言。在这种情况下,我们可以说p值是针对原假设的证据的度量。
但是,与贝叶斯因子相比,p值的可解释性范围较小-p值与针对零值的证据“数量”之间的联系很复杂。p值过小或过快-使其难以正确使用。他们倾向于夸大对数据提供的null的支持。如果我们解释p值作为对空概率-在赔率形式是,当实际证据是,和的比值形式是时实际的证据是。换句话说,使用p值作为此处null为假的概率等同于设置先验赔率。所以对于 p值0.193.870.05196.830.1相对于null的隐含先验几率是,对于p值,相对于null的隐含先验几率是。2.330.052.78