p值是点估计吗?


32

由于可以计算p值的置信区间,并且由于区间估计的对立面是点估计:p值是点估计吗?


6
我不认为可以计算出p值的置信区间;它是根据数据计算的统计信息,而不是描述数据生成过程的参数。当然,您仍然可以问一个统计量估计值。
Scortchi-恢复莫妮卡

1
@Scortchi:但是,如果我要应用自举法来计算p值的分布,然后构造该自举分布的95%百分位区间,那么,如果这不是p值的置信区间,那是什么?呢
变形虫说莫妮卡(

2
@amoeba:置信区间大约是一个未知参数,而您的自举区间是一个统计数据的95%区域的近似值。
西安

@Scorthci:我看过为p值打印CI的软件。在这种情况下,近似的p值是通过置换检验计算得出的,因此,如果CI太宽(即p值和p值),则可以使用在进行推断之前需要进行更多的排列。[ 0.05 1 ][0,0.05][0.05,1]
悬崖AB

4
@Cliff这不是分布的p值qua属性的置信区间:这是针对特定样本的测试的p值的随机估计量的置信区间。尽管它们听起来很相似,并且两者都是间隔,但它们是完全不同的东西。
ub

Answers:


23

点估计和置信区间用于描述分布的参数,例如平均值或标准偏差。

但是,与其他样本统计数据(例如样本均值和样本标准差)不同,p值不是有用的分布参数的有用估计量。请查看@whuber的答案以获取技术详细信息。

对于检验统计量的p值,可以观察到与检验统计量的期望值的偏差至少与样本中观察到的偏差一样大,该概率是在假设为零的假设为真的情况下计算得出的。如果您拥有整个分布,则它要么与原假设一致,要么与原假设不一致。这可以通过指标变量来描述(再次参见@whuber的答案)。

但是p值不能用作指标变量的有用估计量,因为p值不一致,因为如果零假设成立,p值就不会随着样本量的增加而收敛。这是一种非常复杂的替代方法,它表明统计测试可以拒绝或不能拒绝空值,但从不进行确认。


3
大多数有关统计检验的更好的解释(雷曼,基弗等)根本不涉及“人口”,而是根据估计分布参数来构造情况 这不要求随机性仅是由于采样引起的,因此允许该理论更广泛地应用于其中随机性是模型的一部分的情况。
ub

2
但是,您已经明确地指出,该声明“根本没有与人口相关的概率”。还请注意,所有估计量都“在样本级别上明确定义”。因此,很难确定您要在这篇文章中做出什么区分。
ub

2
当然!但是分布不是人口。
豪伯

4
(-1)我同意@Tim的常识性回答和whuber的隐瞒性回答,但是我很难理解这一点。(1)“但是p值不是人口参数,因为它是在样本级别上明确定义的”:毫无疑问,值得指出,但是“ but”使您好像在说p值可以因为这是样本统计量,所以不能作为任何事物的估计,就好像样本均值不能因为它是样本统计量而对任何事物进行估计。...
Scortchi-恢复莫妮卡

2
(2)“这是因为根本没有与总体相关联的概率,被认为是固定的,但未知”:(a)由于 “没有概率[。,所以没有从样本中计算出p值。 。]“; (b)正如@whuber所指出的那样,从有限的总体中采样是一种特殊情况;(c)在任何情况下,p值都不能完全代表您对p值的估计。
Scortchi-恢复莫妮卡

21

是的,可能(并且一直)认为p值是点估计。

为了确定p值可能估计的分布的任何属性,我们必须假定它是渐近无偏的。但是,渐近而言,原假设的平均p值是(理想情况下;对于某些检验,它的值可能是其他一些非零数),而对于其他假设,它的平均p值是。因此,可以将p值视为原假设的指标函数的一半的估计量。01/20


诚然,以这种方式查看p值需要一些创造力。通过将有问题的估计量视为我们通过p值做出的决策,我们可以做得更好:基础分布是原假设或替代假设的成员吗?我们称这组可能决定。杰克·基弗写道D

我们假设有一个实验,统计学家可以观察到其结果。该结果由随机变量或随机向量 ...描述。的概率定律是未知的统计学家,但已知的分布函数的是一个特定类的成员的分布函数。...X ˚F X ΩXXFXΩ

如果是的某些实数或向量值属性的可能值的集合,该统计问题被认为是点估计的问题,而的某些实值或矢量值属性以合理的平滑方式依赖于˚F ˚FDFF

在这种情况下,因为是离散的,所以“合理地平滑”根本不是限制。Kiefer的术语通过将具有离散决策空间的统计过程称为“测试”而不是“点估计器”来反映这一点。D

尽管探究此类定义的局限性很有趣,正如这个问题邀请我们去做的那样,也许我们不应该过分强调p值是点估计器,因为估计器和测试之间的区别是有用和常规。


在对这个问题的评论中,克里斯蒂安·罗伯特(Christian Robert)引起了人们对1992年论文的关注,他和他的合著者正是采用了这种观点,并分析了p值作为指标函数估计量的可接受。请参阅以下参考资料中的链接。论文开始

假设检验的方法通常将检验问题视为决策而非估计之一。更确切地说,正式的假设检验将得出关于假设是否正确的结论,而不是提供与该结论相关的证据措施。在本文中,我们将假设检验视为决策理论框架内的一个估计问题

[重点已添加。]


参考文献

Jiunn Tzon Hwang,George Casella,Christian Robert,Martin T.Wells和Roger H.Farrell,测试准确性的估计。安 统计员。第20卷第1期(1992),490-509。 开放访问

杰克·卡尔·基弗(Jack Carl Kiefer),《统计推断》。施普林格出版社,1987年。


2
嗯 我不确定这种观点是否有帮助。从这个意义上来说,p值不是一个好的估计值,因为如果原假设为真,则p值就不一致。在某些情况下(您提到),它也具有样本大小相关的偏差。这在技术上可能是正确的,但是任何参数的随机数估计也是(可怕的)估计值。
Erik

10
这个问题并没有问p值是否是一个很好的估计值@Erik。作为估计量,它有明显的缺陷。例如,原假设的渐近方差为非零。请注意,几乎每个无偏估计量的偏倚取决于样本量。尽管您可以将独立的随机数视为一个估计量是正确的,但它可能是另一个不同的估计量:它将估计自己的均值(按定义)。因此,您的异议似乎与眼前的问题没有任何关系。
ub

7
我认为除了@Erik以外,我们在上述几点上都没有区别,只是“无用的”部分。正如尼克·考克斯(Nick Cox)在该线程其他地方的评论中所指出的那样,考虑将p值视为估算器的含义以及确切地可以估算的含义是很有趣的。这可以帮助我们更好地了解p值是(不是)p值。许多人会认为这是有益的练习。
ub

7
1992年的一篇论文中,我们研究了值作为指标函数的估计量,并证明了它可以作为单边假设的可接受估计量,并且是不可接受的对于两个假设。Θ 0θ pIΘ0(θ)
西安

1
@西安我知道我们只比你落后23年...。感谢您的参考!
ub

11

p -值用于估计感兴趣的任何参数,但假设检验。例如,您可能有兴趣根据所拥有的样本估算总体,或者可能对其间隔估算感兴趣,但是在假设检验方案中,您宁愿将样本均值与总体均值看看它们是否不同。实际上,在假设检验方案中,您对它们的特定值感兴趣,而是对它们的某个阈值以下(例如)感兴趣。与 μ ¯ X μ p < 0.05 p pμx¯μp<0.05p-values您对它们的点值没有太大兴趣,而是想知道您的数据是否提供了足够的证据反对原假设。在假设检验方案中,您不会将不同的彼此进行比较,而是使用它们中的每一个对您的假设做出单独的决策。只要您知道是否可以拒绝,就不需要了解有关船壳假设的任何信息。这使得它们的值与决策上下文不可分割,因此它们与点估计不同,因为对于点估计,我们对它们的值本身很感兴趣。p


5
您的最初声明正确地回响了通常如何解释的内容,但是,它还不够深入。这里的一个基本事实是样本差异,即样本之间的差异。取不同的样本,您的P值将有所不同。准确地了解它的估计值需要一点技巧,并且(据我所知)将其解释为估计参数不是常规做法,但是这种观点很有意义。参见@whuber有趣的答案。(基于简化教学的需要,整个领土到处都是泥泞的措辞。)
Nick Cox

1
术语的使用方式很有趣而且很重要(顺便说一句,也是个人的专心)。问题仍然是P值多少。这个线程的其他地方也指出了这一点。将参数视为模型规范中出现的未知数是一个有用的约定,但是也存在其他未知数。
尼克·考克斯

3
@蒂姆,我认为(至少在生物学上)这种说法(根据您的最后评论)几乎总是不正确的。人们对p值的值非常感兴趣,在图形上用一颗,两颗或三颗星标记,,,写着“高度重要”的东西,等等。建议还报告精确的p值,例如,而不是。人们很少遵循严格的Neyman-Pearson框架,预先选择并将所有p值报告为。p < 0.01 p < 0.001 p = 0.003 p < 0.05 α p < αp<0.05p<0.01p<0.001p=0.003p<0.05αp<α
变形虫说恢复莫妮卡

5
这个问题与许多其他问题相交,其中大多数是有争议的。一种理想情况是,测试的目的是做出是或否的决定,而这根本无法解决所有问题。另一个关键事实是,阈值水平的使用已经存在数十年了,人们使用打印表中的已发布表,而人们没有使用计算机时却无法获得确切的P值。
尼克·考克斯

4
@ 00schneider:如果确实看到给定的p值区间,那么通过whuber定义的总体参数的置信区间就不太可能了。蒂姆(Tim)的观点是,尽管可能这样做,但根本不需要考虑它们是对任何事物的估计
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.