基于自举的置信区间


17

在研究基于引导的置信区间时,我曾经阅读以下语句:

如果引导程序分布向右偏斜,则基于引导程序的置信区间会进行校正,以将端点进一步移至右侧;这似乎违反直觉,但这是正确的操作。

我正在尝试理解上述陈述的逻辑基础。


您还记得声明的来源吗?那里可能有一些解释……
jbowman 2011年

Answers:


24

这个问题与置信区间的基本构造有关,当涉及到引导时,答案取决于所使用的引导方法。

请考虑以下设置:是实值参数的估计量,具有(估计的)标准偏差,然后是基于正常近似值为 该置信区间是由满足 的集合得出的, 其中是2.5%的分位数,是的97.5%分位数 θ本身ÑθSE2 θ ±1.96SEθž1 θ -θž2ž1=-1.96SEž2=1.96SEÑ0SE2θ^θSEñθSE2

θ^±1.96SE
θ
ž1个θ^-θž2
ž1个=-1.96SEž2=1.96SEñ0SE2-分配。有趣的观察是,当重新排列不等式时,我们得到的置信区间表示为 就是说,较低的 2.5%分位数确定了右端点,而较高的 97.5%分位数确定了左端点。
{θθ^-ž2θθ^-ž1个}=[θ^-ž2θ^-ž1个]

如果的采样分布与正态近似相比右偏,那么合适的动作是什么?如果右偏表示采样分布的97.5%分位数为,则适当的操作是将左端点向左移动。也就是说,如果我们坚持上面的标准构造。引导程序的标准用法是估算采样分位数,然后在上述结构中使用它们代替。θ^ž2>1.96SE±1.96SE

但是,引导程序中使用的另一种标准构造是百分位数间隔,即 在上面的术语中。对于的采样分布,它只是从2.5%分位数到97.5%分位数的间隔的右偏采样分布表示右偏置信区间。由于上述原因,在我看来,似乎是百分位数间隔的违反直觉的行为。但是它们还有其他优点,例如在单调参数转换下不变。

[θ^+ž1个θ^+ž2]
θ^θ^

由Efron引入的BCa(偏差校正和加速)自举间隔,请参见例如Bootstrap置信区间,它改善了百分位数间隔的属性。我只能猜测(和Google)OP帖子的报价,但也许BCa是合适的上下文。从第193页提到的论文中引用Diciccio和Efron,

以下参数可激发BCa定义(2.3)以及参数和。假设存在一个单调递增变换,使得 正态分布于每个选择,但可能存在偏差和非恒定方差 然后(2.3)给出了准确地准确无误置信限度具有观察一种ž0ϕ=θϕ^=θ^θ

ϕ^ñϕ-ž0σϕσϕ2σϕ=1个+一种ϕ
θθ^

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.