由于可以计算p值的置信区间,并且由于区间估计的对立面是点估计:p值是点估计吗?
由于可以计算p值的置信区间,并且由于区间估计的对立面是点估计:p值是点估计吗?
Answers:
点估计和置信区间用于描述分布的参数,例如平均值或标准偏差。
但是,与其他样本统计数据(例如样本均值和样本标准差)不同,p值不是有用的分布参数的有用估计量。请查看@whuber的答案以获取技术详细信息。
对于检验统计量的p值,可以观察到与检验统计量的期望值的偏差至少与样本中观察到的偏差一样大,该概率是在假设为零的假设为真的情况下计算得出的。如果您拥有整个分布,则它要么与原假设一致,要么与原假设不一致。这可以通过指标变量来描述(再次参见@whuber的答案)。
但是p值不能用作指标变量的有用估计量,因为p值不一致,因为如果零假设成立,p值就不会随着样本量的增加而收敛。这是一种非常复杂的替代方法,它表明统计测试可以拒绝或不能拒绝空值,但从不进行确认。
是的,可能(并且一直)认为p值是点估计。
为了确定p值可能估计的分布的任何属性,我们必须假定它是渐近无偏的。但是,渐近而言,原假设的平均p值是(理想情况下;对于某些检验,它的值可能是其他一些非零数),而对于其他假设,它的平均p值是。因此,可以将p值视为原假设的指标函数的一半的估计量。0
诚然,以这种方式查看p值需要一些创造力。通过将有问题的估计量视为我们通过p值做出的决策,我们可以做得更好:基础分布是原假设或替代假设的成员吗?我们称这组可能决定。杰克·基弗写道
我们假设有一个实验,统计学家可以观察到其结果。该结果由随机变量或随机向量 ...描述。的概率定律是未知的统计学家,但已知的分布函数的是一个特定类的成员的分布函数。...X ˚F X Ω
如果是的某些实数或向量值属性的可能值的集合,该统计问题被认为是点估计的问题,而的某些实值或矢量值属性以合理的平滑方式依赖于˚F ˚F
在这种情况下,因为是离散的,所以“合理地平滑”根本不是限制。Kiefer的术语通过将具有离散决策空间的统计过程称为“测试”而不是“点估计器”来反映这一点。
尽管探究此类定义的局限性很有趣,正如这个问题邀请我们去做的那样,也许我们不应该过分强调p值是点估计器,因为估计器和测试之间的区别是有用和常规。
在对这个问题的评论中,克里斯蒂安·罗伯特(Christian Robert)引起了人们对1992年论文的关注,他和他的合著者正是采用了这种观点,并分析了p值作为指标函数估计量的可接受性。请参阅以下参考资料中的链接。论文开始
假设检验的方法通常将检验问题视为决策而非估计之一。更确切地说,正式的假设检验将得出关于假设是否正确的结论,而不是提供与该结论相关的证据措施。在本文中,我们将假设检验视为决策理论框架内的一个估计问题。
[重点已添加。]
Jiunn Tzon Hwang,George Casella,Christian Robert,Martin T.Wells和Roger H.Farrell,测试准确性的估计。安 统计员。第20卷第1期(1992),490-509。 开放访问。
杰克·卡尔·基弗(Jack Carl Kiefer),《统计推断》。施普林格出版社,1987年。
-值不用于估计感兴趣的任何参数,但假设检验。例如,您可能有兴趣根据所拥有的样本估算总体,或者可能对其间隔估算感兴趣,但是在假设检验方案中,您宁愿将样本均值与总体均值看看它们是否不同。实际上,在假设检验方案中,您对它们的特定值不感兴趣,而是对它们的某个阈值以下(例如)感兴趣。与 μ ¯ X μ p < 0.05 p p-values您对它们的点值没有太大兴趣,而是想知道您的数据是否提供了足够的证据反对原假设。在假设检验方案中,您不会将不同的彼此进行比较,而是使用它们中的每一个对您的假设做出单独的决策。只要您知道是否可以拒绝,就不需要了解有关船壳假设的任何信息。这使得它们的值与决策上下文不可分割,因此它们与点估计不同,因为对于点估计,我们对它们的值本身很感兴趣。