自举样本均值时是否需要居中？

当阅读有关如何近似估计样本均值的分布时，我遇到了非参数自举方法。显然，可以通过的分布来近似的分布，其中表示样本均值引导程序样本。 $\bar{X}_n-\mu$ $\bar{X}_n^*-\bar{X}_n$ $\bar{X}_n^*$

然后我的问题是：我需要居中吗？做什么的？

我不能只用近似吗？ $\mathbb{P}\left(\bar{X}_n \leq x\right)$ $\mathbb{P}\left(\bar{X}_n^* \leq x\right)$

— 克里斯汀
source

我不明白为什么您需要集中任何内容。这里讨论的所有样本大小都一样吗？

— 2012年

大小相同，是的。我也看不到居中的原因。任何人都能够提出数学解释，为什么或为什么我们不必这样做呢？我的意思是，如果我们不居中，是否可以证明引导程序有效或无效？

— 克里斯汀

（顺便说一句，可以在Bickel，PJ和DA Freedman（1981年，自举的一些渐近理论中找到自举对我们居中的情况有效的证据。）

— Christin

我很好奇：为什么这个问题被否决？

— 主教

也许我们进行输入就可以使用中心极限定理，该定理使我们得到收敛到与，即。也许没有这种情况下的渐近疗法就可以告诉我们它是否有效。

n^{\frac{1}{2}} ({\bar{X}}_{n} - μ)

$n^{\frac{1}{2}}(\bar{X}_n-\mu)$

n^{\frac{1}{2}} ({\bar{X}}_{n}^{*} - {\bar{X}}_{n})

$n^{\frac{1}{2}}(\bar{X}_n^*-\bar{X}_n)$

N (0, σ^{2})

$\mathcal{N}(0,\sigma^2)$

— kelu 2012年

是的，您可以通过来近似，但是不是最佳的。这是百分位数引导程序的一种形式。但是，如果您要对总体平均值进行推断，除非您的样本量很大，否则百分位数自举法不能很好地执行。（它在许多其他推断问题上也能很好地发挥作用，包括在样本量小的情况下。）我从威尔科克斯的《现代社会和行为科学统计》，CRC出版社，2012年得出这一结论。。 $\mathbb{P}\left(\bar{X}_n \leq x\right)$ $\mathbb{P}\left(\bar{X}_n^* \leq x\right)$

居中方法的一个变种进入下一步，并使用重新采样的标准偏差和样本大小缩放居中的自举统计量，其计算方法与统计相同。来自这些t统计量分布的分位数可用于构建置信区间或执行假设检验。这是bootstrap-t方法，在对均值进行推断时会给出更好的结果。

令为基于n-1作为分母的基于bootstrap重采样的重采样标准差；和s是原始样本的标准偏差。让 $s^*$

$T^*=\frac{\bar{X}_n^*-\bar{X}}{s^*/\sqrt{n}}$

的模拟分布的第97.5和2.5个百分位数可以通过以下方式为形成置信区间： $T^*$ $\mu$

$\bar{X}-T^*_{0.975} \frac{s}{\sqrt{n}}, \bar{X}-T^*_{0.025} \frac{s}{\sqrt{n}}$

考虑下面的仿真结果，该结果表明在混合分布严重偏斜的情况下，此方法的置信区间包含百分率自举法或传统的at统计量反演而没有自举的情况下，包含真实值的频率更高。

compare.boots <- function(samp, reps = 599){
    # "samp" is the actual original observed sample
    # "s" is a re-sample for bootstrap purposes

    n <- length(samp)

    boot.t <- numeric(reps)
    boot.p <- numeric(reps)

    for(i in 1:reps){
        s <- sample(samp, replace=TRUE)
        boot.t[i] <- (mean(s)-mean(samp)) / (sd(s)/sqrt(n))
        boot.p[i] <- mean(s)
    }

    conf.t <- mean(samp)-quantile(boot.t, probs=c(0.975,0.025))*sd(samp)/sqrt(n)
    conf.p <- quantile(boot.p, probs=c(0.025, 0.975))

    return(rbind(conf.t, conf.p, "Trad T test"=t.test(samp)$conf.int))
}

# Tests below will be for case where sample size is 15
n <- 15

# Create a population that is normally distributed
set.seed(123)
pop <- rnorm(1000,10,1)
my.sample <- sample(pop,n)
# All three methods have similar results when normally distributed
compare.boots(my.sample)

这给出以下内容（conf.t是bootstrap t方法； conf.p是百分位数bootstrap方法）。

          97.5%     2.5%
conf.t      9.648824 10.98006
conf.p      9.808311 10.95964
Trad T test 9.681865 11.01644

通过偏斜分布的一个示例：

# create a population that is a mixture of two normal and one gamma distribution
set.seed(123)
pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
my.sample <- sample(pop,n)
mean(pop)
compare.boots(my.sample)

这给出了以下内容。请注意，“ conf.t”（bootstrap t版本）提供的置信区间比其他两个更大。基本上，它更好地应对人口的异常分布。

> mean(pop)
[1] 13.02341
> compare.boots(my.sample)
                97.5%     2.5%
conf.t      10.432285 29.54331
conf.p       9.813542 19.67761
Trad T test  8.312949 20.24093

最后是一千个模拟，以查看哪个版本给出最正确的置信区间：

# simulation study
set.seed(123)
sims <- 1000
results <- matrix(FALSE, sims,3)
colnames(results) <- c("Bootstrap T", "Bootstrap percentile", "Trad T test")

for(i in 1:sims){
    pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
    my.sample <- sample(pop,n)
    mu <- mean(pop)
    x <- compare.boots(my.sample)
    for(j in 1:3){
        results[i,j] <- x[j,1] < mu & x[j,2] > mu
    }
}

apply(results,2,sum)

这给出了以下结果-数字是置信区间包含模拟总体真实值的1,000倍的时间。请注意，每个版本的真正成功率都大大低于95％。

     Bootstrap T Bootstrap percentile          Trad T test 
             901                  854                  890

— 彼得·埃利斯
source

谢谢，这非常有用。这个.pdf（来自课程）描述了您的结论的警告：psychology.mcmaster.ca/bennett/boot09/percentileT.pdf这是Bennet所说的摘要：许多数据集由> = 0的数字组成（即数据（可以计算在内），在这种情况下，配置项不应包含负值。使用bootstrap-t方法会发生这种情况，使置信区间变得难以置信。数据> = 0的要求违反了正态分布假设。这不是一个问题，当构建一个百分自举CI

— 汉纳斯齐格勒