自举标准误差和置信区间是否适合违反均等假设的回归?


13

如果在标准OLS回归中违反了两个假设(误差的正态分布,均方差),自举标准误差和置信区间是否是一种适当的替代方法,以获得关于回归系数的重要性的有意义的结果?

具有自举标准误差和置信区间的显着性测试是否仍可以“异方差”地“起作用”?

如果是,在这种情况下可以使用的适用置信区间(百分位数,BC,BCA)是多少?

最后,如果在这种情况下自举是合适的,那么需要阅读和引用哪些相关文献才能得出这个结论?任何提示将不胜感激!


1
如果有这种违规行为,我认为引导程序无法解决。相反,为什么不尝试转换(记录)数据以使其接近正常值并使用可靠的标准错误(例如来自R中的三明治包的错误)呢?
B_Miner 2013年

该引导程序,如果你适应了重新采样方案的情况下,你的是正常工作
Glen_b -Reinstate莫妮卡

Answers:


20

至少有三种(可能更多)方法可以对独立但分布不相同的数据执行引导程序以进行线性回归。(如果您还有其他违反“标准”假设的行为,例如由于与时间序列数据的自相关,或者由于抽样设计而导致的聚类,则情况会变得更加复杂)。

  1. 您可以从整体上对观察进行重新采样,即从原始数据{ y ix i}中替换进行采样。这将渐近等效于执行Huber-White异方差校正(yj,xj){(yi,xi)}
  2. ei=yixiβ^xjej
  3. 您可以执行野引导程序,在其中对残差的符号进行重新采样,从而控制条件第二秒(以及有条件的第三时刻的一些额外调整)。这就是我建议的程序(前提是您可以理解它并在被问到“您如何控制异方差?您如何知道它起作用吗?”的情况下为他人辩护)。

最终的参考文献是Wu(1986),但Annals并不完全是图画书。

最新通报基础上,OP的后续问题问的评论:

在我看来,复制品的数量很大。我知道的有关该引导程序参数的唯一很好的讨论是在Efron&Tibshirani的《引导程序简介》一书中

M)在自举和异方差校正之间进行比较。


非常感谢你的帮助!请允许我提出一个后续问题:我违反的唯一假设是错误的正态分布和均方差性假设。另外,我只想知道我的回归系数是否为sig。在预期的方向或否。影响的大小并不重要。我认为到目前为止,您的选择是1。我引导了标准错误,并生成了另外的引导置信区间。我使用Stata做到了这一点:vce(bootstrap,reps(2500)bca),estat引导程序。这样可以治愈我的假设违规吗?
David

我不会仅根据您的语法对数据进行诊断,没有人会这样做。您的数据集的大小是多少?reps(2500)至少对于标准错误而言可能是一个过大的杀伤力;我认为reps(500)对于大多数实际用途来说都可以。Efron&Tibshirani的介绍性引导书中有关于重复次数的章节。他们也有一整章关于回归,因此这可能是您参考的另一本好参考书。
StasK

谢谢你们的快速响应。数据集约为250。除了复制数量的问题(感谢链接!),您是否同意引导标准错误(通过整体重采样观察值)和/或引导置信区间(例如,百分位数或偏差校正)给定均质性和误差正态分布假设,确定回归系数的显着性(或缺乏回归系数)的适当方法?非常感谢您的输入!
David

是的,我会说更好。如果您使用Stata,则可以使用robust回归选项获得非常相似的答案。est store两种结果,est tab, se并进行比较。
StasK 2013年

谢谢StasK。我还看到了您在此站点上其他地方发表的以下评论:“带有重采样的简单自举⇔怀特的异方差稳健估计器”。在上述问题中,是否有发表过的期刊文章证明了这一点?
David
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.