为什么这个摘录说标准偏差的无偏估计通常不相关?


14

我正在阅读标准偏差的无偏估计的计算方法以及我所阅读的资料

(...)除非在某些重要情况下,否则该任务与统计的应用几乎没有关系,因为通过标准程序(例如,使用显着性检验和置信区间或使用贝叶斯分析)可以避免执行此任务。

我想知道是否有人可以阐明该语句背后的原因,例如,置信区间不是将标准差用作计算的一部分吗?因此,置信区间不会受到标准偏差的影响吗?

编辑:

到目前为止,谢谢您的回答,但是我不确定我是否遵循它们的某些推理,因此我将添加一个非常简单的示例。关键是,如果源是正确的,那么从我的结论到示例,都出了点问题,我希望有人指出p值如何依赖于标准偏差。

假设研究人员希望测试他或她所在城市的五年级学生的平均分数是否与全国平均值76分(显着性水平为0.05)不同。研究人员随机抽取了20名学生的分数。样本平均值为80.85,样本标准偏差为8.87。这意味着:t =(80.85-76)/(8.87 / sqrt(20))= 2.44。然后使用t表计算以19 df在2.44时的2尾概率值为0.025。这低于我们的显着性水平0.05,因此我们拒绝零假设。

因此,在此示例中,p值(也许还有您的结论)是否会根据您估计样本标准偏差的方式而改变?


2
出于您的原因,这确实有些奇怪。也许您也可以在没有其他内容的情况下给我们前面的段落?造成偏差不大的一件事是,随着样本数量的增加,偏差变得无关紧要,并且与所有其他问题(例如,我们通常遇到的模型错误指定)相比可能并不重要-但这不是原因在您的来源中给出。
彼得·埃利斯

1
@PeterEllis,这实际上来自Wikipedia页面上的“标准偏差的无偏估计”(en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation)。
BYS2 2012年

Answers:


17

我对此表示赞同。也许我可以加些话以使观点更清楚。如果数据来自方差未知的正态分布(iid情况),则t统计量是用于生成置信区间和进行假设检验的关键量。对该推理唯一重要的是其在零假设(用于确定临界值)和替代条件(用于确定功效和样本)下的分布。这些分别是中央和非中央t分布。现在考虑一下一个样本问题,t检验甚至具有作为正态分布均值检验的最佳属性。现在,样本方差是总体方差的无偏估计量,但其平方根是总体标准差的BIASED估计量。它没有 无论该BIASED估计量都输入枢轴量的分母。现在它确实发挥了作用,因为它是一个一致的估计量。这就是当样本量达到无穷大时,t分布可以接近标准正态的原因。但是对任何固定的偏见不会影响测试的良好性能。n

我认为在介绍性统计课程中过分强调了公正性。估计量的准确性和一致性是值得强调的真实属性。

对于采用参数或非参数方法的其他问题,标准差的估计甚至都没有输入公式中。


7
它的确取决于估计,但是只有一个估计适用19自由度的t,并且该估计是样本方差的通常估计的平方根。如果您使用标准偏差的不同估计值,则在原假设下,检验统计量的参考分配将不同。不是t。
Michael R. Chernick

2
@ BYS2:请注意,在您给出的示例中构造的间隔方面,将样本标准偏差乘以比例因子(例如,使其无偏)不会改变任何结果。在这种情况下,测试统计量的分布会(略有变化)发生变化,但最终构建的CI会完全相同!现在,如果您进行了一些依赖于数据本身的“校正”,那将产生不同的结果(通常)。请参阅我在Glen的回答下的评论。
主教

4
@ BYS2:在使用统计量的正常模型情况下,CI与p值之间存在很好的对应关系。因此,如果按已知常数“重新缩放”样本标准偏差,则p值将不会更改。例如:设Ť b = ˉ X - μ /b ·&σ= Ť / b为固定b > 0。然后,PŤ b > Ù = PtppT~b=(X¯μ)/(bσ^)=T/bb>0等的临界值 b α = b α,即,在它们之间的一对一的对应。那有意义吗?
P(T~b>u)=P(T>bu)
t~b,α=btα
主教

1
Cardinal没有正确指出的是,可以将t统计量乘以一个常数,从而本质上使用不同的标准差估算值。检验统计量不再具有t分布。由于常数,它的分布略有不同。平均值变化系数为b,标准偏差也变化。如上所示,当您要计算测试统计数据的关键值时,它会适当地更改。
Michael R. Chernick

1
@ BYS2是的,正确。
Michael R. Chernick

5

考虑基于枢轴数量(如t统计量)计算的间隔。标准差的估计量的平均值并没有真正包括在内-间隔基于统计量的分布。因此,该声明就目前而言是正确的。


1
是的,但是统计信息的分布不依赖于大多数情况下未知的标准偏差吗,因此您需要使用估计量吗?
BYS2

4
(+1)格伦。致@ BYS2:这里有几个关键点。首先,如果手头有一个关键量,它为构建置信度集提供了非常方便的方法,但它们并不经常存在。的枢转量的整体的一点是,分布取决于纯粹已知的量。其次,关键数量与基础模型密切相关。如果数据偏离假定的模型,则检验统计量的分布也可能会如此,并且其作为关键量的特征可能就不太相关了。:)
主教

4

解释始终是推测的一部分,但是我认为隐含的含义是,您通常可以在不显式估计标准偏差的情况下获得所需的结果。换句话说,我觉得作者指的是在那里你会使用的情况下没有标准偏差估计,而不是偏估计。

例如,如果您可以构建统计信息整体分布的估计,则可以在不使用标准偏差的情况下计算置信区间。实际上,对于许多(非正态)分布,标准差本身(以及均值)不足以计算置信区间的估计值。在其他情况下,例如符号测试,您也不需要估计标准偏差。

(当然,构造一个 完整分布无偏估计,在贝叶斯统计中,实际上很普遍地通过先验引入偏见。)


1
对上一段的含义进行更全面的扩展可能会很有趣。例如,如果我可以从当前统计信息的分布中进行抽样,那么经验cdf提供了一种非常简单的方法来生成分布函数的逐点无偏估计。:)
主教

1
maxiXimaxiXiXi

1
XiimaxiXi

2
这是正确的,接近我试图提出的观点。最后一段的第一句话是指根据例如单个随机样本构建非线性统计函数的无偏估计。这与从函数本身的随机样本构造完整分布的无偏估计完全不同。:-)
红衣主教
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.