从引导式重采样中获得的置信区间是什么意思?


38

我一直在这个站点上查看有关自举和置信区间的许多问题,但我仍然感到困惑。我感到困惑的部分原因可能是我的统计学知识不够先进,无法理解很多答案。我正在学习统计学入门课程,但是我的数学水平仅是中代数II,因此超出该水平的任何内容都会使我感到困惑。如果该站点上的一位知识渊博的人可以在我一级上解释此问题,那将非常有帮助。

我们在课堂上学习如何使用bootstrap方法进行重采样,并使用它们为我们要测量的某些统计数据建立置信区间。因此,举例来说,假设我们从大量人口中抽样,发现40%的人表示将投票给候选人A。我们假设此样本是对原始人口的准确反映,在这种情况下,我们可以从发现有关人口的信息。因此,我们进行了重新抽样,发现(使用95%的置信度)所得的置信区间为35%至45%。

我的问题是,这个置信区间实际上什么意思

我一直在读,(频率)置信区间和(贝叶斯)可信区间是有区别的。如果我理解正确,可信区间将表示在我们的情况下,真实参数有95%的机会在给定区间内(35%-45%),而置信区间将表示在区间中有95%情况类型(但不一定是我们的情况),我们使用的方法将准确地报告true参数在给定间隔内。

假设这个定义是正确的,我的问题是:使用引导程序方法建立的置信区间时,我们所说的“真实参数”是什么?我们是指(a)原始种群的真实参数,还是(b)样本的真实参数?如果是(a),那么我们可以说95%的时间引导方法将准确报告有关原始人口的真实陈述。但是我们怎么可能知道呢?整个引导程序方法不是基于这样的假设原始样本是否准确反映了其来源?如果是(b),那么我完全不了解置信区间的含义。我们是否不知道样本的真实参数?这是一个简单的测量!

我与老师讨论了这个问题,她很有帮助。但是我还是很困惑。

Answers:


28

如果引导程序和置信区间的形成正确执行,则意味着与其他任何置信区间相同。从常客的角度来看,95%的置信区间意味着如果无限次重复进行整个研究,则以这种方式形成的95%的置信区间将包含真实值。当然,在您的研究中或在任何给定的个人研究中,置信区间将包括或不包括真实值,但是您将不知道哪个。为了进一步理解这些想法,它可能会帮助您在这里阅读我的答案:为什么95%的置信区间(CI)并不意味着95%的机会包含均值?

x¯μ。为了快速进行数学演示,请考虑使用以下模拟R

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952

我们所依赖的特定假设是什么?
iarwain14年

2
谢谢。我想我在该线程的第二个答案中找到了我想要的东西:“请记住,我们没有使用引导样本的平均值来估计总体平均值,而是为此使用了样本平均值(或任何感兴趣的统计数据)但是,我们正在使用引导样本来估计采样过程的属性(扩展,偏差),并使用来自已知总体(我们希望代表感兴趣的总体)的采样来了解采样的影响而且循环性要差得多。” ...
iarwain 2014年

1
...换句话说,所有置信区间告诉我们的是,在与我们大致相似的总体中,我们希望从该总体中抽取的样本中有95%能够反映出真实值+/-误差范围。因此,我们所做的只是给出一个非常粗略的线索-尽管也许是我们最好的线索-来说明样本统计量可能与真实总体参数的接近程度。如果是这样,那么听起来我们不应该太在乎CI中的确切数字-它们只是表示“样本统计数据大概在这个程度上大致准确”。我说对了吗?
iarwain 2014年

1
基本上是正确的。CI可让我们了解估算的精确度,但我们不知道实际(已实现)CI是否确实包含真实值。主要假设是我们的数据可以代表感兴趣的人群。请注意,这些都不是自举 CI 所特有的,在通过渐近理论计算的CI中,您具有相同的解释和假设。
gung-恢复莫妮卡

1
这是一个很好的解释。我只补充说,“真实价值”有时是研究设计的产物。在对政治候选人进行民意测验时,分层样本比随机样本能给出更准确,更可靠的估计。这样做的代价是有可能因设计而对错误的组进行过度采样。在那种情况下,95%的置信区间以正确的值为中心,该值是通过无限次复制研究广告而获得的,但该值并不是真正参数的另一种含义:我们想要估算的参数。这就是为什么研究设计和推理具有内在联系的原因。
AdamO

0

您要说的是,无需从引导重采样中找到置信区间。如果您对自举重采样获得的统计信息(样本均值或样本比例)感到满意,请不要找到任何置信区间,因此也就不用解释了。但是,如果您对自举重采样获得的统计数据不满意或满意,但仍想找到置信区间,则该置信区间的解释与任何其他置信区间相同。这是因为当您自举的重采样准确地代表(或假设是如此)原始人口时,那么需要置信区间呢?自举重采样中的统计信息是原始总体参数本身,但是当您不将统计信息视为原始总体参数时,则需要找到置信区间。因此,这全都与您的考虑方式有关。假设您从引导重采样中计算出95%的置信区间。现在的解释是:“在95%的情况下,此引导方法准确地导致包含真实总体参数的置信区间”。

(这就是我的想法。如果有任何错误,请纠正我)。


-1

我们指的是原始人口的真实参数。可以假设数据是从原始总体中随机抽取来进行的-在那种情况下,数学论证表明自举程序将给出有效的置信区间,至少在数据集的大小变得足够大的情况下。


因此,听起来似乎是为了理解其工作原理,我需要了解足够的数学知识以遵循数学证明。那是对的吗?
iarwain

我认为是这样(我不熟悉证明)
Gareth 2014年

从直觉上看,您可以看到随着样本数量的增加,样本开始看起来很像总体。例如,假设我从具有给定均值和方差的正态分布中抽取了100万个样本。将此样本称为X。从X抽取的随机样本(带有替换)看起来很像从原始分布抽取的随机样本。我认为这是工作原理的基本思想。
Gareth 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.