引导程序:估计值超出置信区间


10

我使用混合模型(带有交互作用的多个变量和一个随机变量)进行了引导。我得到了这个结果(只是部分):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

现在,我想获取截距的置信区间:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

校正后的偏差估计为:

48.873 -1.677
1 47.196

我的问题是正常CI和基本CI在估计值之外(原始值和校正值)。我只是想知道如何应对。

更新1:
是一个类似的问题,有很多答复。


2
只需评论一下:经典著作中的Efron&Tibshirani(1993)主张反对偏差校正,称这是“危险”和“问题”做法,可能会导致标准误差增加。
蒂姆

@Tim感谢您的评论。我会看这本书。也许一种解决方案是使用估计值和引导程序se *来计算置信区间。在我的情况下,偏差只会对估算产生轻微影响。
giordano

Answers:


1

您面临的困难来自隐含的数学。位置估计器的中心或间隔估计器可以被认为是分布上成本函数的最小化。高斯样本均值使二次损失最小,而中值使高斯绝对线性损失函数最小。即使在人口中它们位于同一点,也可以使用不同的成本函数来发现它们。

我们给您一个算法并说“执行此操作”,但是在算法开发之前,有人解决了一个优化问题。

您已经应用了四个不同的成本函数,为您提供了三个间隔和一个点估计量。由于成本函数不同,因此它们为您提供了不同的时间点和间隔。除了手动统一方法之外,没有其他可做的事情。

您需要找到基础文章并查看基础代码,以了解哪些映射到哪些类型的问题。

不好意思地说,但是您被该软件出卖了。它完成了它的工作,并且平均来说效果很好,但是您得到了该软件无法使用的示例。或者,相反,它运行良好,您需要在文献中实际回溯以确定它的实际作用。


感谢它的工作,平均而言,它的效果很好,但是您获得了该软件无法正常工作的示例以及其他见解。确实,该示例很奇怪,这就是为什么我想要使用Bootsstrap来计算CI的原因。显然,此方法似乎并不像看起来那样简单。
giordano
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.