Answers:
chl在使用同一数据集同时进行25次测试时已经提到了多个比较的陷阱。一种简单的处理方法是通过将p值阈值除以测试次数来调整(在本例中为25)。更精确的公式为:调整后的p值= 1-(1- p值)^(1 / n)。但是,两个不同的公式得出的调整后的p值几乎相同。
假设检验练习还有另一个主要问题。您肯定会遇到Type I错误(误报),从而发现一些真正的琐碎差异,这些差异在99.9999%的水平上极为重要。这是因为当您处理一个如此大的样本(n = 1,313,662)时,您会得到非常接近0的标准误差。这是因为1,313,662 = 1146的平方根。因此,您将标准偏差除以1,146。简而言之,您将捕获可能完全无关紧要的微小差异。
我建议您远离此假设检验框架,而进行效果大小类型分析。在此框架内,统计距离的度量是标准偏差。与标准误差不同,标准偏差不会被样本大小人为地缩小。而且,这种方法将使您更好地了解数据集之间的实质差异。效果大小还更加关注均值均值周围的置信区间,比假设检验关注通常根本不重要的统计显着性要有意义得多。希望能有所帮助。
随着自由度的增大,学生的t分布越来越接近标准正态分布。在自由度为1313662 + 38704 – 2 = 1352364的情况下,t分布与标准正态分布是无法区分的,如下图所示(除非您处于极端的尾部并且您对将绝对微小的p值与甚至更小的p值区分开)。因此,您可以将表格用于标准正态分布,而不是将表格用于t-分布。
可以肯定的是,由于您的数据集包含25个变量,因此您要进行25个测试?在这种情况下,您可能需要更正多个比较,以免增加I型错误率(请参阅本网站上的相关主题)。
顺便说一句,R软件会为您提供所需的p值,而无需依赖表:
> x1 <- rnorm(n=38704)
> x2 <- rnorm(n=1313662, mean=.1)
> t.test(x1, x2, var.equal=TRUE)
Two Sample t-test
data: x1 and x2
t = -17.9156, df = 1352364, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1024183 -0.0822190
sample estimates:
mean of x mean of y
0.007137404 0.099456039