基于自举的置信区间

在研究基于引导的置信区间时，我曾经阅读以下语句：

如果引导程序分布向右偏斜，则基于引导程序的置信区间会进行校正，以将端点进一步移至右侧；这似乎违反直觉，但这是正确的操作。

我正在尝试理解上述陈述的逻辑基础。

confidence-interval bootstrap

— 用户名
source

您还记得声明的来源吗？那里可能有一些解释……

— jbowman 2011年

这个问题与置信区间的基本构造有关，当涉及到引导时，答案取决于所使用的引导方法。

请考虑以下设置：是实值参数的估计量，具有（估计的）标准偏差，然后是基于正常近似值为该置信区间是由满足的集合得出的，其中是2.5％的分位数，是的97.5％分位数 $\hat{\theta}$ $\theta$ $\text{se}$ $N(\theta, \text{se}^2)$

\hat{θ} \pm 1.96 SE 。

$\hat{\theta} \pm 1.96 \text{se}.$

θ

$\theta$

ž_{1个} \leq \hat{θ} - θ \leq ž_{2}

$z_{1} \leq \hat{\theta} - \theta \leq z_2$

z_{1} = - 1.96 se

$z_1 = -1.96\text{se}$

z_{2} = 1.96 se

$z_2 = 1.96\text{se}$

N (0, {se}^{2})

$N(0, \text{se}^2)$ -分配。有趣的观察是，当重新排列不等式时，我们得到的置信区间表示为就是说，较低的 2.5％分位数确定了右端点，而较高的 97.5％分位数确定了左端点。

{θ ∣ \hat{θ} - ž_{2} \leq θ \leq \hat{θ} - ž_{1个}} = [\hat{θ} - ž_{2} ， \hat{θ} - ž_{1个}] 。

$\{\theta \mid \hat{\theta} - z_2 \leq \theta \leq \hat{\theta} - z_1 \} = [\hat{\theta} - z_2, \hat{\theta} - z_1].$

如果的采样分布与正态近似相比右偏，那么合适的动作是什么？如果右偏表示采样分布的97.5％分位数为，则适当的操作是将左端点向左移动。也就是说，如果我们坚持上面的标准构造。引导程序的标准用法是估算采样分位数，然后在上述结构中使用它们代替。 $\hat{\theta}$ $z_2 > 1.96\text{se}$ $\pm 1.96 \text{se}$

但是，引导程序中使用的另一种标准构造是百分位数间隔，即在上面的术语中。对于的采样分布，它只是从2.5％分位数到97.5％分位数的间隔的右偏采样分布表示右偏置信区间。由于上述原因，在我看来，这似乎是百分位数间隔的违反直觉的行为。但是它们还有其他优点，例如在单调参数转换下不变。

[\hat{θ} + ž_{1个} ， \hat{θ} + ž_{2}] 。

$[\hat{\theta} + z_1, \hat{\theta} + z_2].$

\hat{θ} .

$\hat{\theta}.$

\hat{θ}

$\hat{\theta}$

由Efron引入的BCa（偏差校正和加速）自举间隔，请参见例如Bootstrap置信区间，它改善了百分位数间隔的属性。我只能猜测（和Google）OP帖子的报价，但也许BCa是合适的上下文。从第193页提到的论文中引用Diciccio和Efron，

以下参数可激发BCa定义（2.3）以及参数和。假设存在一个单调递增变换，使得正态分布于每个选择，但可能存在偏差和非恒定方差然后（2.3）给出了准确地准确无误置信限度具有观察 $a$ $z_0$ $\phi = m(\theta)$ $\hat{\phi} = m(\hat{\theta})$ $\theta$
$\hat{ϕ} 〜 ñ （ ϕ - ž_{0} σ_{ϕ} ， σ_{ϕ}^{2} ）， σ_{ϕ} = 1个 + 一种 ϕ 。$ $\hat{\phi} \sim N(\phi - z_0 \sigma_{\phi}, \sigma_{\phi}^2), \quad \sigma_{\phi} = 1 + a \phi.$ $\theta$ $\hat{\theta}$

$m$

— NRH
source