Answers:
上面的答案更加直观,因此我尝试更严格。
什么是GLM?
令表示一组响应和维协变量向量,期望值为。对于独立观测,每个的分布是密度为的指数族 在这里,感兴趣的参数(自然或规范参数)是,是比例参数(已知或被视为令人讨厌),而和是已知功能。该ÿ p X = (X 1,... ,X p)ë (Ý )= μ 我= 1 ,... ,Ñ ÿ 我 ˚F (ÿ 我 ; θ 我,φ )= EXP { [ ÿ 我θ 我 - γ (θ 我)] /θ 我 φ γ τ Ñ p X 1,... ,X p η 我 = β 0 + β 1 X 我1个 + ⋯ + β p X 我p θ 我 θ = (γ ' )- 1(μ )η θ μ 克(
函数称为链接函数。如果函数以连接,和,则此链接称为规范链接,形式为。
而已。然后,使用规范链接有许多理想的统计属性,例如,对于分量,足够的统计量为,对于如果发现ML估计量一致,则这些链接简化了MLE的推导,它们确保线性回归的某些属性(例如,残差之和为0)成立,或者确保保持在结果变量的范围内。Σ 我X 我Ĵ ÿ 我
因此,它们倾向于默认使用。但是请注意,没有先验的理由可以说明模型中的效果应在此链接或任何其他链接给定的比例上加和。
gung引用了一个很好的解释:规范链接具有最小的充分性的特殊理论属性。这意味着您可以通过以结果数为条件来定义条件logit模型(经济学家称其为固定效应模型),但是您无法定义条件probit模型,因为没有足够的统计数据可用于probit链接。
这是从MIT的18.650类中汲取灵感的小图,我发现它非常有用,因为它有助于可视化这些功能之间的关系。我使用了与@momo帖子中相同的符号:
因此,链接函数 将线性预测变量与平均值相关联,并且要求其是单调递增的,连续可微的和可逆的。
该图允许轻松地从一个方向转到另一个方向,例如:
θ = γ ' - 1(克- 1(η ))
使用Momo严格描述的另一种方法是,当是规范链接函数时,则函数组成 是身份,因此我们得到 γ - 1 ∘ 克- 1 = (克∘ γ ' ) - 1 = 我θ = η