我正在阅读有关大规模回归(link)的问题,whuber指出了一个有趣的观点,如下所示:
“几乎所有运行的统计测试都将非常强大,以至于几乎可以确定“显着”的影响。您必须更加关注统计的重要性,例如影响的大小,而不是重要性。”
---胡布
我想知道这是可以证明的东西还是在实践中只是一些常见现象?
任何指向证明/讨论/模拟的指针都将非常有用。
我正在阅读有关大规模回归(link)的问题,whuber指出了一个有趣的观点,如下所示:
“几乎所有运行的统计测试都将非常强大,以至于几乎可以确定“显着”的影响。您必须更加关注统计的重要性,例如影响的大小,而不是重要性。”
---胡布
我想知道这是可以证明的东西还是在实践中只是一些常见现象?
任何指向证明/讨论/模拟的指针都将非常有用。
Answers:
这几乎是一般的。
想象有一个很小的但非零的影响(即,与测试能够拾取的零值有些偏差)。
在小样本量的情况下,被拒绝的可能性将非常接近I型错误率(噪声占较小影响)。
随着样本量的增加,估计效应应收敛于该总体效应,同时,估计效应的不确定性会减小(通常为),直到无效情况足够接近估计效果(在总体中从随机选择的样本中仍然有可能被接受)的机会降低为有效零。
这就是说,对于零点,最终拒绝是确定的,因为在几乎所有实际情况下,与零点的偏差总是一定的。
这不是证明,但在实践中不难证明样本量的影响。我想使用一个来自Wilcox(2009)的简单示例,并进行一些小的更改:
我们可以使用t检验进行此分析:
对于,,我们可以拒绝原假设。保持其他所有条件不变,增加样本数量将减少分母,并且您更有可能在采样分布的关键(拒绝)区域中获得值。注意,是平均值的标准误的估计。因此,您可以看到类似的解释如何应用于例如线性回归中获得的回归系数的假设检验,其中。
Wilcox,RR,2009年。《基本统计资料:了解传统方法和现代见解》。牛津大学出版社,牛津。
在回归中,对于整体模型,测试在F上进行。
RSS1RSS2