对置信区间感到困惑


10

我对置信区间的概念感到困惑。具体地说,假设有一个高斯变量σ已知的,并且我对所述下限μ 大号平均值的与95 的置信水平。XN(μ,σ)σμL95%

我将进行次实验,并观察X 1X 2X 3X 4X 55X1X2X3X4X5

选项1:我单独处理每个样品,我可以计算每个X 。然后,我想有一些方法(我不知道如何)来计算实际低这些势必5 μ 大号的。μL=XiσzXiμL

选项2:在另一方面,如果我采取,我可以计算μ 大号 = Ť - σ / T=(X1+X2+X3+X4+X5)/5。(假设T正常,我们也可以使用t-stat。)μL=Tσ/5zT

除了选项2之外,是否还有其他方法可以基于样本计算下限?对于选项1,是否有一种方法可以基于计算出的5个下限来计算下限?5

Answers:


12

这是一个很好的问题,因为它探讨了替代程序的可能性,并要求我们考虑为什么以及如何使一种程序优于另一种程序。

简短的答案是,我们可以设计出无数种方法来设计一种方法来降低均值的置信度,但是其中有些更好,有些则更糟(在某种意义上是有意义的和定义明确的)。选项2是一个很好的过程,因为使用它的人需要收集的数据少于使用选项1的人的一半,才能获得质量相当的结果。一半的数据通常意味着一半的预算和一半的时间,因此,我们谈论的是实质性且在经济上重要的差异。 这提供了统计理论价值的具体证明。


与其重新讨论存在许多优秀教科书的理论,不如让我们快速探索已知标准偏差的独立正态变量的三个下置信限(LCL)过程。我选择了该问题建议的三个自然的和有前途的。它们中的每一个都由所需的置信度1 - α确定n1α

  • 选项1a,“最小”过程。的置信下限设定为等于。数的值ķ 分钟α Ñ σ被确定为使得所述机会分钟将超过真实平均数μ只是α ; 也就是说,Pr t mintmin=min(X1,X2,,Xn)kα,n,σminσkα,n,σmintminμαPr(tmin>μ)=α

  • 选项1b,“最大”过程。的置信下限设定为等于。数的值ķ 最大α Ñ σ被确定为使得所述机会最大将超过真实平均数μ只是α ; 即Pr t maxtmax=max(X1,X2,,Xn)kα,n,σmaxσkα,n,σmaxtmaxμαPr(tmax>μ)=α

  • 选项2,“平均”程序。的置信下限设定为等于。数的值ķ 平均α Ñ σ被确定为使得所述机会平均将超过真实平均数μ只是α ; 即Pr t 均值tmean=mean(X1,X2,,Xn)kα,n,σmeanσkα,n,σmeantmeanμαPr(tmean>μ)=α

如众所周知的,其中ΦŽα=1-α; Φ是标准正态分布的累积概率函数。这是问题中引用的公式。数学上的简写是kα,n,σmean=zα/nΦ(zα)=1αΦ

  • kα,n,σmean=Φ1(1α)/n.

最小最大过程的公式鲜为人知,但易于确定:

  • kα,n,σmin=Φ1(1α1/n)

  • kα,n,σmax=Φ1((1α)1/n)

通过模拟,我们可以看到所有三个公式都起作用。以下R代码分别进行实验n.trials,并报告每个试验的所有三个LCL:

simulate <- function(n.trials=100, alpha=.05, n=5) {
  z.min <- qnorm(1-alpha^(1/n))
  z.mean <- qnorm(1-alpha) / sqrt(n)
  z.max <- qnorm((1-alpha)^(1/n))
  f <- function() {
    x <- rnorm(n); 
    c(max=max(x) - z.max, min=min(x) - z.min, mean=mean(x) - z.mean)
  }    
  replicate(n.trials, f())
}

μ=0σ=1kα,n,σσ

10,000次试验将提供足够的准确性。让我们运行模拟并计算每个过程未能产生小于真实均值的置信度极限的频率:

set.seed(17)
sim <- simulate(10000, alpha=.05, n=5)
apply(sim > 0, 1, mean)

输出是

   max    min   mean 
0.0515 0.0527 0.0520

α=.05

.05.05(0.050547,0.049877,0.050274)

X1,X2,,Xn100σ

我们可以评估我们的三个LCL程序趋向于多么准确。 一个很好的方法是查看它们的采样分布:等效地,许多模拟值的直方图也可以。他们来了。但是首先,产生它们的代码:

dx <- -min(sim)/12
breaks <- seq(from=min(sim), to=max(sim)+dx, by=dx)
par(mfcol=c(1,3))
tmp <- sapply(c("min", "max", "mean"), function(s) {
  hist(sim[s,], breaks=breaks, col="#70C0E0", 
       main=paste("Histogram of", s, "procedure"), 
       yaxt="n", ylab="", xlab="LCL");
  hist(sim[s, sim[s,] > 0], breaks=breaks, col="Red", add=TRUE)
})

直方图

它们显示在相同的x轴上(但垂直轴略有不同)。我们感兴趣的是

  1. 0α=.05

  2. 0952σ3σ

最右边的直方图描述了选项2,即传统的LCL程序。

这些利差的一种度量是模拟结果的标准偏差:

> apply(sim, 1, sd)
     max      min     mean 
0.673834 0.677219 0.453829

0.680.45

0.450.450.200.45/0.21


2
你永远不会令我惊讶。
Momo 2012年

+1 @whuber这是一个很好的例证。在描述引导置信区间时,Efron谈到了准确性和正确性。准确性是该间隔的真实置信度接近广告值。您的3个例子都是正确的。正确是最好的。对于双向置信区间,这意味着宽度最短的准确区间(区间或边界取决于您的情况下的均值)。您的示例很有趣,因为这三种方法至少有些竞争。
Michael R. Chernick 2012年

由于我在回答中给出的原因,OP选项1几乎没有竞争力。
Michael R. Chernick 2012年

@Michael我同意对选项1 解释没有竞争力。我发现有趣的是-在这里进行了探索-有人对如何从五个单独的“计算实际下界”进行一些更可行的解释,我在这里已经研究了其中的两个。我可能也应该仔细研究“中位数”选项:它不会比一般的计算差很多(效率降低约40%)。
ub

1

第一个选项未考虑您从样本中获得的减少的方差。第一个选项基于每种情况下的大小为1的样本,为您提供了五个较低的95%置信区间。通过平均组合它们不会创建一个可以解释为下限95%的界限。没有人会这样做。第二种选择是做什么。五个独立观察的平均值的方差比单个样本的方差小6倍。因此,它给您的下界要比用第一种方法计算出的五个下界更好。

i

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.