回归中的Wald检验(OLS和GLM):t分布与z分布


22

我了解Wald回归系数检验基于渐近成立的以下属性(例如Wasserman(2006):All Statistics,第153、214-215页): 其中表示估计的回归系数,\ widehat {\ operatorname {se}}(\ hat {\ beta})表示回归系数的标准误差,\ beta_ {0}是相关值(\ beta_ {0}通常为0,以测试系数是否为与0明显不同)。这样大小\阿尔法 Wald检验是:拒绝H_ {0}

β^-β0SE^β^ñ01个
β^SE^β^β0β0αH0|w ^|>žα/2,其中
w ^=β^SE^β^

但是,当您使用lmR 进行线性回归时,将使用Ť值而不是ž值来测试回归系数是否显着不同于0(带有summary.lm)。此外,glmR中的输出有时会给出ž,有时会给出Ť作为测试统计量。显然,假设色散参数已知时使用z值,而模拟色散参数则使用t值(请参阅此链接)。žŤ

有人可以解释一下,为什么即使系数和其标准误的比率被假定为标准正态分布,但有时还是将Ť用于Wald检验?

回答问题后进行编辑

这篇文章还为问题提供了有用的信息。


2
是什么让您认为报告的测试统计数据必然是Wald检验?
Glen_b-恢复莫妮卡

3
因为ž -或Ť -值总是系数通过它的标准误差在划分lmglm
COOLSerdash

Answers:


20

glm使用泊松分布的输出给出值,因为对于泊松分布,均值和方差参数相同。在泊松模型中,您只需要估计一个参数()。在必须估计均值离差参数的地方,应该看到使用的。žλglmŤ

对于标准线性回归,您假设误差项为正态分布。在这里,必须估计方差参数-因此,将用于检验统计量。如果您以某种方式知道误差项的总体方差,则可以使用 -test统计量。Ťž

正如您在帖子中提到的那样,测试的分布是渐近正态的。所述 -配送是渐近正常的,所以大的样品中,差异可以忽略不计。Ť


3

通常,在GLM框架中,您提到的W检验统计量是渐近 正态分布的,这就是为什么在R中看到z值的原因。

除此之外,具有线性模型,即GLM具有正态分布的响应变量打交道时,检验统计量的分布一个学生的t,所以在[R牛逼值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.