分析
因为这是一个概念上的问题,为简单起见让我们考虑这种情况,其中,置信区间[ ˉ X(1 ) + Ž α / 2小号(1 ) / √1−α被构造为一个平均值μ使用随机样本X(1)大小的ñ和第二随机样本X(2)取大小米,全部来自同一普通(μ,σ2)的分布。(如果愿意,可以用自由度为n−1的Studentt分布中的值替换Zs;以下分析不会改变。)
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
第二个样本的平均值位于第一个样本确定的CI内的机会为
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
因为第一个样本均值与第一个样本标准差(这需要正态性)独立,而第二个样本与第一个样本标准偏差独立,所以样本均值独立于。此外,对于该对称间隔。因此,为随机变量写并平方两个不等式,则所讨论的概率与x¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
期望定律表明的均值为,方差为U0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
由于是正态变量的线性组合,因此它也具有正态分布。因此,是乘以变量。我们已经知道是乘以变量。因此,是具有分布的变量的倍。 所需概率由F分布给出为UU2σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
讨论区
一个有趣的情况是,第二个样本的大小与第一个样本的大小相同,因此且只有和确定概率。下面是的值作图为。n/m=1nα(1)αn=2,5,20,50
随着增加,曲线在每个处上升到极限值。传统测试尺寸用垂直灰线标记。对于较大值,的极限机会约为。αnα=0.05n=mα=0.0585%
通过了解此限制,我们将了解小样本量的细节,并更好地了解问题的症结。随着增大,分布接近分布。根据标准正态分布,概率近似为n=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
例如,对于,和。因此,随着增加,在处曲线获得的极限值为。您可以看到它几乎已经达到(机会为。α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
对于较小的,与互补概率之间的关系几乎完全是幂定律,而CI是CI 不能覆盖第二均值的风险。αα 另一种表达方式是对数互补概率几乎是的线性函数。极限关系约为logα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
换句话说,对于较大的和,接近传统值任何地方,将接近n=mα0.05(1)
1−0.166(20α)0.557.
(这使我想起了很多我在/stats//a/18259/919上发布的重叠置信区间的分析。的确,那里的魔力几乎是魔力的倒数此处为。此时,您应该能够根据实验的可重复性重新解释该分析。)1.910.557
实验结果
这些结果通过简单的模拟得到了证实。以下R
代码返回覆盖率,使用计算的机会以及Z分数以评估它们之间的差异。Z分数的大小通常小于,与(甚至是否计算或 CI)无关,这表明公式的正确性。2 Ñ ,米,μ ,σ ,α ž 吨(1 )(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))