现在,我更好地了解了让我担心配对t检验与未配对t检验以及相关的p值的问题。发现是一个有趣的旅程,并且一路上有许多惊喜。对迈克尔的贡献进行的调查令人惊讶。就实践建议而言,这是无可指责的。此外,他说了我认为几乎所有统计学家都相信的观点,并且他有几项支持这一观点的投票。但是,从理论上讲,这实际上并不正确。我通过制定p值的公式,然后仔细考虑如何使用公式得出反例来发现了这一点。我是经过培训的数学家,而反例是“数学家的反例”。实际统计中不会遇到这种情况, 当我问最初的问题时,我试图找到的那种东西。
这是提供反示例的R代码:
vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
X <- rnorm(vLength)
Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
Paired <- t.test(X,Y,var.equal=T,paired=T)
NotPaired <- t.test(X,Y,var.equal=T,paired=F)
c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))
请注意以下特征:X和Y是两个10元组,它们的差很大并且几乎恒定。对许多有效数字而言,相关系数为1.000。...未配对测试的p值比配对测试的p值小10 ^ 40倍。因此,这与迈克尔的叙述相矛盾,只要人们按数学家的方式从字面上读他的叙述即可。至此,我的答案部分与迈克尔的答案有关。
这是彼得的回答引起的想法。在讨论原始问题时,我在一条评论中推测,听起来不同的p值的两个特定分布实际上是相同的。我现在可以证明这一点。更重要的是,该证明揭示了p值的基本性质,如此基本,以至于没有文字(我遇到过)困扰着解释。也许所有的专业统计学家都知道这个秘密,但是对我来说,p值的定义总是显得奇怪而虚假。在透露统计学家的秘密之前,让我先指出一个问题。
n > 1ñ2 (n − 1 )n − 1自由程度。这两个分布是不同的,那么p值的关联分布到底如何呢?经过深思熟虑后,我才意识到这种明显的驳斥我的想法太容易了。
F:(0 ,∞ )→ (0 ,∞ )[ 0 ,1 ]
p = ∫∞ŤF(小号)ds
F(- ∞ ,∞ )[ 0 ,∞ )
[ 0 ,1 ]
n − 1[ 0 ,1 ]2 (n − 1 )[ 0 ,1 ][ 0 ,1 ]