声明它可以验证我的分销选择是否太过分了?
这取决于您确切地表示“验证”的意思,但是我会说“是的,那太过分了”,就像您不能真正说“ null被证明是真实的”一样,(尤其是点为零,但至少在某种意义上更普遍)。您只能说“嗯,我们没有强有力的证据证明这是错误的”。但是无论如何,我们都不希望我们的模型是完美的,而是模型。就像Box&Draper所说的,重要的是“ 它们必须是多么错误才能变得无用? ”
以下两个句子中的任何一个:
(对我而言)这似乎表明,选择高斯分布非常合理。或者至少,残差与我在模型中使用的分布一致。
更准确地描述您的诊断所指示的内容-不是带有对数链接的高斯模型是正确的 -而是合理的或与数据一致的。
我选择了一个日志链接函数,因为我的响应变量始终为正,但是我想要某种确认,它是一个不错的选择。
如果您知道它必须为正,则其均值必须为正。选择至少与之一致的模型是明智的。我不知道这是否是一个好选择(可能会有更好的选择),但这是一个合理的选择。这很可能是我的出发点。[但是,如果变量本身必须为正,则我的第一个想法将趋向于具有对数链接的Gamma,而不是高斯。“必然为正”的确表明偏度和方差随均值而变化。]
问题2:是否有任何测试可以支持我对链接功能的选择,例如检查残差以选择分布?
听起来您的意思不是“形式假设检验”中的“检验”,而是“诊断检查”。
无论哪种情况,答案都是肯定的。
一个正式的假设检验是Pregibon的善意链接检验 [1]。
这是基于将链接功能嵌入Box-Cox系列中,以便对Box-Cox参数进行假设检验。
另请参见Breslow(1996)[2]中有关Pregibon检验的简短讨论(请参见第14页))。
但是,我强烈建议您坚持使用诊断路线。如果您要检查链接功能,则基本上是在链接范围内断言,η=克(μ ) 是线性的 X是模型中的,因此一项基本评估可能会查看残差与预测变量的关系图。例如,
工作残差 [Rw ^一世= (y一世- μ^一世)(∂η∂μ)
(我倾向于此评估),或者通过查看部分残差的线性偏差,为每个预测变量绘制一个图(例如,参见Hardin和Hilbe,《广义线性模型和扩展》,第二版,第4.5版) .4 p54,用于定义),
[RŤķ 我= (y一世- μ^一世)(∂η∂μ) + x我ķβ^ķ
= rw ^一世+ x我ķβ^ķ
在数据允许通过链接函数进行转换的情况下,您可以采用与线性回归相同的方式来寻找线性(尽管您可能留下偏度和异方差)。
对于分类预测变量,链接函数的选择更多是出于便利性或可解释性的问题,因此拟合度应相同(因此无需对其进行评估)。
您也可以根据Pregibon的方法进行诊断。
这些并不构成详尽的清单。您可以找到讨论的其他诊断。
[也就是说,我同意gung的评估,即在可能的情况下,链接功能的选择最初应基于诸如理论上的考虑。]
也看到一些讨论在这个岗位,这至少部分是相关的。
[1]:Pregibon,D。(1980年),
“广义线性模型的链接检验的优良性”
,皇家统计学会杂志。系列C(应用统计),
第 29,第1号,第15-23页。
[2]:Breslow NE(1996),
“广义线性模型:检验假设和加强结论”,《
统计应用》,第 8卷,第23-41页。
pdf格式