通过bootstrap t方法或仅通过bootstrap估计均值的置信区间?


9

在估计均值的置信区间时,我认为bootstrap t方法和非参数bootstrap方法都可以应用,但是前者需要更多的计算。

我想知道bootstrap t相对于普通非参数bootstrap的优缺点是什么?为什么?

有一些参考资料可以解释这一点吗?

Answers:


9

引导程序Ť 仍然依赖于参数分布的假设:如果统计数据的boostrap分布具有正态分布,则可以使用bootstrap-Ť方法。这将导致对称CI。

但是,如果采样分布偏斜或有偏差,则最好使用百分位引导程序(允许不对称CI)。

现在,您应该使用哪种方法?

关于自举平均值:根据Wilcox(2010)的模拟,应该将百分位数引导程序用于未修剪的均值(在这种情况下,引导程序-Ť效果更好);从20%修剪开始,百分位引导程序的性能优于引导程序-Ť (对于10%的修整情况尚不清楚)。

另一个提示来自Hesterberg等。(2005年,第14-35页):

安全使用bootstrap t和bootstrap百分位数间隔的条件有点含糊。我们建议您通过相互比较来检查这些间隔是否合理。如果自举分布的偏差较小,并且该分布接近正态分布,则自举t和百分位数置信区间将非常一致。与t间隔不同,百分间隔不忽略偏度。因此,只要偏差很小,百分数间隔通常会更准确。因为我们很快会遇到更精确的引导程序间隔,所以我们的建议是,当引导程序t和引导程序百分位间隔不一致时,则不应使用任何间隔类型。

->如果有分歧,最好使用BCa校正的引导程序CI!


Hesterberg,T.,Monaghan,S.,Moore,D.,Clipson,A。和Epstein,R。(2005)。自举方法和置换测试。统计学实践导论,14.1–14.70。

Wilcox,RR(2010)。现代统计方法的基础:显着提高功能和准确性。施普林格出版社。


1
我同意您的建议,即不应将百分位数引导程序用于未经修饰的均值,但我认为bootstrap-t方法需要基本的总体呈正态分布通常并不正确。请参阅我对stats.stackexchange.com/questions/39297/…的回答。
彼得·埃利斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.