给定足够大的样本量,除非真实的效果量正好为零,否则测试将始终显示出显着的结果。为什么?


21

我对Wikipedia的文章有关效应大小的说法感到好奇。特别:

除非人口效应大小恰好为零,否则非零统计比较将始终显示统计上有意义的结果

我不确定这意味着什么/暗示什么,更不用说支持它的论点了。我想毕竟是一种效应,是一种统计量,即从一个样本计算出的值及其自身的分布。这是否意味着效果永远不会仅因随机变化(我理解这意味着不重要)而引起?我们是否仅考虑效果是否足够强-绝对值高?

我正在考虑我最熟悉的效果:Pearson相关系数r似乎与此矛盾。为什么会有在统计上有意义?如果小,我们的回归线 [R[R

ÿ=一种X+b=[RsÿsX=ϵX+b

对于ϵ小,接近于0,F检验将可能包含一个包含0的斜率的置信区间。这不是反例吗?


10
提示:您引用的部分之前的子句至关重要。“ 给定足够大的样本量,除非人口效应大小恰好为零,否则非空的统计比较将始终显示统计上显着的结果……”
Kodiologist

@Kodiologist:但是,以我的示例为例,这是否意味着如果样本数量更大,则r本身也将更大,或者,如果样本数量更大,至少表达式会更大?我没看到 r(sy/sx)
加里

5
如果这不是真的,那将是统计方法中的一个缺陷。如果,则肯定有一些样本大小足以检测差异。μ>μ0
John Coleman '18

Answers:


26

举一个简单的例子,假设我正在使用一些统计的巨无霸估算您的身高。

您总是向别人说自己身高177厘米(约5英尺10英寸)。

如果我要检验这个假设(您的身高等于177 cm,),并且我可以充分减少测量中的误差,那么我可以证明您实际上并不是 177 cm。最终,如果我估计您的身高到足够的小数位,您几乎肯定会偏离所述的身高177.00000000 cm。也许您是177.02厘米;我只需将我的误差减小到小于.02即可发现您不是177厘米。h=177

如何减少统计信息中的错误?获取更大的样本。如果获得足够大的样本,则误差会变得很小,以至于您可以从零假设中检测出最小的偏差。


2
这是一个非常清晰简洁的解释。它可能比更多的数学答案更有助于理解为什么会这样。做得好。
没人

1
很好地解释了这一点,但我认为在某些情况下声明的值是真实准确的也很重要。例如,撇开弦论等中发生的怪异事物,对我们宇宙空间维数的测量(可以做到)将得到3,无论您进行这种测量的精度如何,您都会永远不会始终发现3的统计上的显着偏差。当然,如果您进行了足够多次的测试,您将仅仅由于方差而得出一些偏差,但这是一个不同的问题。
David Z

可能是一个幼稚的问题,但是如果我声称自己是177厘米,那么有效数字的概念是否就意味着我只是在176.5至177.5之间?答案似乎给出了一个很好的理论概念,是正确的,但是它不是基于错误的前提吗?我想念什么?
JimLohse

在这种情况下,声明的高度177类似于统计中的原假设。在传统的相等性假设检验中,您要声明相等性(例如)。关键是,无论您声明的身高是多少,除非零假设完全正确,否则我可以通过减少误差来证明这一点。我用身高作为一个易于理解的例子,但是这个概念在其他领域是相同的(物质x不会引起癌症,这种硬币是公平的,等等)μ=177
Underminer

13

正如@Kodiologist指出的,这实际上与大样本量会发生什么有关。对于小样本量,没有理由不能出现误报或误报。

我认为 -test使渐近情况最清楚。假设我们有X 1... X Ñ IID Ñμ 1 ,我们要测试ħ 0μ = 0 VS ħ μ 0。我们的测试统计量是 ž Ñ = ˉ X ñ - 0zX1,,XniidN(μ,1)H0:μ=0H一种μ0

žñ=X¯ñ-01个/ñ=ñX¯ñ

所以Zn=X¯nN(μ,1n)。我们感兴趣的是P|žñ|αP|žÑ|α=Pžñ-α+PżÑα=1+Φ-α-μZn=nX¯nN(μn,1)P(|Zn|α)

P(|Zn|α)=P(Znα)+P(Znα)
ÿÑ01是我们的参考变量。下ħ0μ=0,所以我们有P|žÑ|α=1-P-αŸα,所以我们可以选择α,以根据需要控制我们I型误差率。但下ħμ
=1+Φ(αμn)Φ(αμn).
YN(0,1)H0 μ=0P(|Zn|α)=1P(αYα)αHA ,从而 P|žÑ|α1+Φ±-Φ±=1 这样的概率是1,我们将拒绝ħ0如果μ0(在±是在以下情况下μ<0,但无论哪种方式,无限号都具有相同的符号)。μn0
P(|Zn|α)1+Φ(±)Φ(±)=1
H0μ0±μ<0

μ 0μ01nHA1n

H0:ρ=ρ0HA:ρρ01


1
μ<0Zn

1
μ=0X¯p0n

1
@DeltaIV,对,如果收敛速度不同,则需要不同的缩放比例才能获得非退化的零分布。但是对于当前示例,root-n是正确的速率。
Christoph Hanck '18

1
ñX¯收敛到一个标准的正常由CLT,0
家伙

7

可以说他们说的错误的,如果除了他们使用“这总是发生” 之外没有其他原因的话。

我不知道这是否是您所困惑的症结所在,但我将其发布,因为我想很多人都会对此感到困惑:

X 如果发生 ñ足够大“确实不是意味着”如果ñ>ñ0, 然后 X”。

相反,这意味着 ñX=1个

他们的字面意思是:

对于任何样本量 ñ 超过一些最小尺寸 ñ0,如果真实效果的大小不完全为零,则可以保证任何非空测试的结果都是有效的。

什么,他们试图说,虽然是以下情况:

对于任何显着性水平,随着样本数量的增加,如果真实效果的大小不完全为零,则非零检验产生显着结果的概率接近1。

这里有一些关键的区别:

  • 没有保证。只有更大的样本量,您更有可能获得显着的结果。现在,他们可以回避部分责任,因为到目前为止,这只是一个术语问题。在概率情况下,它理解的是,声明“如果n是足够大的,则X” 可以也可以解释为“X变得越来越可能会像真正的N变大”
    但是,一旦他们说“总是”发生,这种解释就消失了。这里适当的术语是说这种情况“很有可能 ”发生1

  • 这是次要的,但是他们的措辞令人困惑-似乎暗示您将样本大小固定为“足够大”,然后该陈述对于任何显着性水平都成立。但是,无论精确的数学陈述是什么,这实际上都没有意义:您总是首先确定显着性水平,然后选择样本大小足够大。
    但是不幸的是,关于它可能以另一种方式出现的建议强调ñ>ñ0 解释“足够大”,使上述问题更加严重。

但是一旦您了解了文学作品,您就会明白他们想说的话。

(附带说明:顺便说一句,这恰恰是许多人对Wikipedia经常遇到的问题之一。通常,如果您已经知道这些材料,就只能理解他们在说什么,因此,这仅对参考或提醒有用,而不是作为自学教材。)

1对同伴(嗨!),是的,该术语的含义比我所链接的含义更具体。我们在这里可能想要的最宽松的技术术语是“几乎肯定地渐近地”看这里


“如果真实效果的大小恰好为零,则非零检验产生显着结果的概率接近0”可能不是很正确:如果检验具有显着性水平α 那么产生重大结果的概率可能是 α或所有样本数量的大约
亨利

@亨利:哦,射击,你是对的!我写得这么快,我没有停下来思考。万分感谢!我已经解决了。:)
Mehrdad

3

我最喜欢的例子是按性别划分的手指数。绝大多数人有10个手指。一些由于事故而失去了手指。有些人有多余的手指。

我不知道男人的手指平均数是否比女人多。所有容易获得的证据表明,男人和女人都有十根手指。

但是,我非常有信心,如果我对所有男性和女性进行普查,那么我就会知道一种性别(平均而言)比另一种性别要多。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.