为什么我们需要引导程序?


16

我目前正在阅读拉里·瓦瑟曼(Larry Wasserman)的“所有统计信息”,并对他在有关估计非参数模型的统计函数的章节中写的内容感到困惑。

他写了

“有时我们可以通过一些计算找到统计函数的估计标准误差。但是,在其他情况下,如何估计标准误差并不明显”。

我想指出的是,在下一章中,他将讨论引导程序以解决此问题,但是由于我不太了解该声明,因此我没有完全获得引导程序背后的动力吗?

当不清楚如何估计标准误差时,有什么例子呢?

所有迄今为止我见过的例子已经“明显”,如然后^ 小号Èp Ñ= X1,...Xn Ber(p)se^(p^n)=p^(1p^)/n


Answers:


16

两个答案。

  1. 两种均值之比的标准误差是多少?中位数的标准误差是多少?任何复杂统计的标准误差是多少?也许有一个封闭的形式方程式,但是可能没有人解决过。
  2. 为了将公式用于平均值的标准误,我们必须做一些假设。如果违反了这些假设,则不必使用该方法。正如@Whuber在评论中指出的那样,引导程序使我们可以放宽一些假设,因此可能会提供更适当的标准错误(尽管它可能还会做出其他假设)。

2
答案1很好,但是答案2似乎是个问题,因为引导程序也做出了假设。我想要指出的是,它通常会做出与其他流行过程不同的假设,但这只是我对您要说的话的猜测,我可能会误解。
ub

@Whuber-谢谢,我添加了一些说明。
杰里米·迈尔斯

5
感谢您的修改。但是,引导是否通常会做出不同的假设,而不是实际上放松一些假设?例如,估计样本均值的SE所需的假设是数据为id,基础分布具有有限的方差。在这种情况下,引导程序实际上必须添加假设:除非样本量“足够大”,否则引导程序不起作用。尽管这似乎使技术上有些争执,但我要解决的是大局:引导既不是灵丹妙药也不总是适用。
ub

3
@JeremyMiles引导程序并非没有假设。您需要验证分布对于大多数自举错误计算是否至关重要,这通常比为标准错误获得一致的估计量更为复杂。另外,均值比具有从δ方法获得的非常容易的误差近似值。因此,我不认为该示例符合OP的观点。
AdamO

9

XYW

E[Y|X]=β0+β1XE[Y|X,W]=γ0+γ1X+γ2W

β1γ1

Y

我们将采用两个模型:1,根据年龄,性别,收入和心脏病家族史等其他混杂因素对吸烟和结局进行调整,然后2:所有先前的协变量以及体重指数。模型1和模型2之间的吸烟效果差异是我们推论的依据。

H:β1=γ1K:β1γ1

T=β1γ1S=β1/γ1TSp


TSTS

TS

γ2=0

@whuber啊,我很困惑。请在此处查看MacKinnon推荐文章
AdamO 2015年

TSTTT

2

对于每个统计量度都有参数解将是理想的,但是同时,这是非常不现实的。在这些情况下,Bootstrap会派上用场。在我脑海中浮现的例子涉及两种成本分布高度偏差的方法之间的差异。在那种情况下,经典的两样本t检验不能满足其理论要求(由于右尾较长,因此从中抽取被调查样本的分布肯定会偏离正态),并且无参数检验无法传达对决策者(通常对职级不感兴趣)的有用信息。避免因该问题而陷入停顿的可能解决方案是两样本自举t检验。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.