GLM:验证分发和链接功能的选择


14

我有一个采用高斯分布和对数链接函数的广义线性模型。拟合模型后,我检查残差:QQ图,残差与预测值,残差的直方图(确认需要格外小心)。一切看起来都很好。(对我而言)这似乎表明,选择高斯分布非常合理。或者至少,残差与我在模型中使用的分布一致。

问题1:声明它能验证我的发行选择是否太过分了?

我选择了一个日志链接函数,因为我的响应变量始终为正,但是我想要某种确认,它是一个不错的选择。

问题2:是否有任何测试可以支持我对链接功能的选择,例如检查残差以选择分布?(对我来说,选择链接功能似乎有些武断,因为我可以找到的唯一指导是非常模糊和动摇的,大概是出于充分的理由。)


2
Q1。您可以尝试其他发行版,看看它们是否表现更好。Q2。选择日志链接以确保肯定的预测对我来说似乎不是武断的。这是一个理由。但是,是否可以通过身份链接获得否定预测,以及可以反过来检查您拥有的数据。底线:在尝试了其他模型之前,您无法清楚其他模型是否会更好。
尼克·考克斯

1
Yexp(η)R2

2
[R2

Answers:


13
  1. 这是关于是否可以主张原假设的常见问题的变体。在您的情况下,零将是残差是高斯的,并且对图(qq图,直方图等)的目视检查构成了“测试”。(有关断言为空的问题的一般概述,这可能有助于在这里阅读我的答案:统计学家为什么说不重要的结果意味着“您不能拒绝零”而不是接受零假设?)在您的特定情况下,您可以说这些图显示您的残差与您对正态性的假设是一致的,但是它们并不能“验证”该假设。

  2. 您可以使用不同的链接函数拟合模型并进行比较,但是并没有单独测试单个链接函数的方法(这显然是不正确的,请参阅@Glen_b的答案)。在我对logit模型和probit模型之间的区别的回答(虽然并不完全相同,可能值得一读,虽然值得一读)时,我认为应该基于以下条件选择链接函数:

    1. 了解响应分布,
    2. 理论上的考虑,以及
    3. 对数据的经验拟合。

    在该框架内,高斯模型的规范链接将是身份链接。在这种情况下,您可能出于理论原因而拒绝了这种可能性。我怀疑你的想法是ÿ不能取负值(请注意,“没有发生”并非同一件事)。如果是这样,则日志是先验的合理选择,但它不仅会阻止ÿ从负变为负,它还引起曲线关系的特定形状。残差与拟合值的标准图(可能带有黄土拟合)可以帮助您确定数据中的固有曲率是否与对数链接所施加的特定曲率合理匹配。正如我提到的,您还可以尝试其他任何符合您理论要求的变换,然后直接比较两者的适合度。


16

声明它可以验证我的分销选择是否太过分了?

这取决于您确切地表示“验证”的意思,但是我会说“是的,那太过分了”,就像您不能真正说“ null被证明是真实的”一样,(尤其是点为零,但至少在某种意义上更普遍)。您只能说“嗯,我们没有强有力的证据证明这是错误的”。但是无论如何,我们都不希望我们的模型是完美的,而是模型。就像Box&Draper所说的,重要的是“ 它们必须多么错误才能变得无用?

以下两个句子中的任何一个:

(对我而言)这似乎表明,选择高斯分布非常合理。或者至少,残差与我在模型中使用的分布一致。

更准确地描述您的诊断所指示的内容-不是带有对数链接的高斯模型是正确的 -而是合理的或与数据一致的。

我选择了一个日志链接函数,因为我的响应变量始终为正,但是我想要某种确认,它是一个不错的选择。

如果您知道它必须为正,则其均值必须为正。选择至少与之一致的模型是明智的。我不知道这是否是一个选择(可能会有更好的选择),但这是一个合理的选择。这很可能是我的出发点。[但是,如果变量本身必须为正,则我的第一个想法将趋向于具有对数链接的Gamma,而不是高斯。“必然为正”的确表明偏度和方差随均值而变化。]

问题2:是否有任何测试可以支持我对链接功能的选择,例如检查残差以选择分布?

听起来您的意思不是“形式假设检验”中的“检验”,而是“诊断检查”。

无论哪种情况,答案都是肯定的。

一个正式的假设检验是Pregibon的善意链接检验 [1]。

这是基于将链接功能嵌入Box-Cox系列中,以便对Box-Cox参数进行假设检验。

另请参见Breslow(1996)[2]中有关Pregibon检验的简短讨论(请参见第14页))。

但是,我强烈建议您坚持使用诊断路线。如果您要检查链接功能,则基本上是在链接范围内断言,η=Gμ 是线性的 X是模型中的,因此一项基本评估可能会查看残差与预测变量的关系图。例如,

工作残差 [R一世w ^=ÿ一世-μ^一世ημ

(我倾向于此评估),或者通过查看部分残差的线性偏差,为每个预测变量绘制一个图(例如,参见Hardin和Hilbe,《广义线性模型和扩展》,第二版第4.5版) .4 p54,用于定义),

[Rķ一世Ť=ÿ一世-μ^一世ημ+X一世ķβ^ķ

=[R一世w ^+X一世ķβ^ķ

在数据允许通过链接函数进行转换的情况下,您可以采用与线性回归相同的方式来寻找线性(尽管您可能留下偏度和异方差)。

对于分类预测变量,链接函数的选择更多是出于便利性或可解释性的问题,因此拟合度应相同(因此无需对其进行评估)。

您也可以根据Pregibon的方法进行诊断。

这些并不构成详尽的清单。您可以找到讨论的其他诊断。

[也就是说,我同意gung的评估,即在可能的情况下,链接功能的选择最初应基于诸如理论上的考虑。]

也看到一些讨论在这个岗位,这至少部分是相关的。

[1]:Pregibon,D。(1980年),
“广义线性模型的链接检验的优良性”
,皇家统计学会杂志。系列C(应用统计)
第 29,第1号,第15-23页。

[2]:Breslow NE(1996),
“广义线性模型:检验假设和加强结论”,《
统计应用》,第 8卷,第23-41页。
pdf格式

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.