1
使用Bootstrap估计回归系数置信区间的两种方法
我正在对数据应用线性模型: ÿ一世= β0+ β1个X一世+ ϵ一世,ϵ一世〜ñ(0 ,σ2)。ÿ一世=β0+β1个X一世+ϵ一世,ϵ一世〜ñ(0,σ2)。 y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). 我想使用自举方法来估计系数(,)的置信区间(CI)。我可以通过两种方式应用bootstrap方法: β 1β0β0\beta_{0}β1个β1个\beta_{1} 配对响应预测器样本:对对进行随机重采样,并将线性回归应用于每次运行。后跑,我们得到的估计系数的集合。最后,计算的分位数。中号^ β Ĵ,Ĵ = 1 ,。。。米^ β Ĵÿ一世− x一世ÿ一世-X一世y_{i}-x_{i}米米mβĴ^,Ĵ = 1 ,。。。米βĴ^,Ĵ=1个,。。。米{\hat{\beta_{j}}}, j=1,...mβĴ^βĴ^{\hat{\beta_{j}}} 样本误差:首先对原始观测数据应用线性回归,从该模型中我们获得和误差。然后,对误差随机重采样,并使用和 。再次应用线性回归。后跑,我们得到估计coefficeints集合。最后,计算的分位数。βØ^βØ^\hat{\beta_{o}}ϵ一世ϵ一世\epsilon_{i}ϵ∗一世ϵ一世∗\epsilon^{*}_{i}βØ^βØ^\hat{\beta_{o}}ÿ∗一世= βØ^X一世+ ϵ∗一世ÿ一世∗=βØ^X一世+ϵ一世∗y^{*}_{i}=\hat{\beta_{o}}x_{i}+\epsilon^{*}_{i}米米mβĴ^,Ĵ = 1 ,。。。,米βĴ^,Ĵ=1个,。。。,米{\hat{\beta_{j}}}, j=1,...,mβĴ^βĴ^{\hat{\beta_{j}}} 我的问题是: 这两种方法有何不同? 在哪种假设下这两种方法给出的结果相同?