GLM的“链接功能”和“规范链接功能”有什么区别


65

术语“链接功能”和“规范链接功能”有什么区别?另外,使用一个相对于另一个有什么(理论上的)优势?

例如,可以使用许多链接函数(例如logitprobit等)二进制响应变量进行建模。但是,这里的logit被视为“规范”链接函数。


10
我在这里广泛讨论链接函数:logit模型和probit模型之间的区别,着重于二进制响应变量的回归。尽管该讨论中只有一小部分集中在链接功能是“规范”的含义上,但是它可能对阅读有所帮助。请注意,要了解规范与非规范链接函数的区别b / t和优点,需要深入了解GLiM的数学基础。
gung

Answers:


68

上面的答案更加直观,因此我尝试更严格。

什么是GLM?

令表示一组响应和维协变量向量,期望值为。对于独立观测,每个的分布是密度为的指数族 在这里,感兴趣的参数(自然或规范参数)是,是比例参数(已知或被视为令人讨厌),而和是已知功能。该ÿ p X = X 1... X pë Ý = μ = 1 ... Ñ ÿ ˚F ÿ ; θ φ = EXP { [ ÿ θ - γ θ ] /Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyiθ φ γ τ Ñ p X 1... X p η = β 0 + β 1 X 1个 + + β p X p θ θ = γ ' - 1μ η θ μ

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτn解释变量的固定输入值的三维向量由。我们假设输入向量仅通过线性函数影响线性变量,线性预测因子 取决于。可以证明,此依赖关系是通过均值连接线性预测变量和来建立的。更具体地说,平均值被视为线性预测变量的可逆和平滑函数,即 px1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ)ηθμ
g(μ)=η or μ=g1(η)
现在回答您的问题:

函数称为链接函数。如果函数连接,则此链接称为规范链接,形式为g()μηθηθg=(γ)1

而已。然后,使用规范链接有许多理想的统计属性,例如,对于分量,足够的统计量为,对于如果发现ML估计量一致,则这些链接简化了MLE的推导,它们确保线性回归的某些属性(例如,残差之和为0)成立,或者确保保持在结果变量的范围内。Σ X Ĵ ÿ Xyixijyij=1,,pμ

因此,它们倾向于默认使用。但是请注意,没有先验的理由可以说明模型中的效果应在此链接或任何其他链接给定的比例上加和。


5
+ 1,@ Momo这是一个非常好的答案。我确实发现某些方程式被埋在段落中时更难于理解,因此我通过使用双美元符号(即$ $)来“屏蔽”它们。我希望可以(如果没有,您可以回退,但要道歉)。
gung

1
@Momo这里的原始问题确实包含了Wei的问题,因此值得指出的是尚未得到明确的答案。
Glen_b 2014年

1
我希望我能正确理解您的困惑:在您谈论的指数族中,规范参数为,规范链接为,即。同样(如果计算相对于似然函数的的一阶导数的期望值),唯一的情况是当。θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)
Momo 2014年

1
非常感谢你。使用前面的示例,我们具有。因此。正如您所说(我只是改写),如果是规范链接(即logit ),则只有。然后我们将有。因此,如果使用规范链接函数,则和预测变量仅存在相等性。γ'-1=(。)分对数η=θθ=öπ=ηθηγ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθη
Druss2k 2014年

2
答案的关键句似乎有错别字:它不应该读成“如果函数将和 st ”?θ η ≡μθηθ
Leo Alekseyev

16

gung引用了一个很好的解释:规范链接具有最小的充分性的特殊理论属性。这意味着您可以通过以结果数为条件来定义条件logit模型(经济学家称其为固定效应模型),但是您无法定义条件probit模型,因为没有足够的统计数据可用于probit链接。


您能否详细说明一下最低充裕度?通过以上解释,我们仍然可以定义一个概率模型,对吗?肯定不会是规范链接函数,但是使用非规范链接函数有什么害处。
pikachuchameleon

9

这是从MIT的18.650类中汲取灵感的小图,我发现它非常有用,因为它有助于可视化这些功能之间的关系。我使用了与@momo帖子中相同的符号:

在此处输入图片说明

  • γ(θ)是累积矩生成函数
  • g(μ)是链接函数

因此,链接函数 将线性预测变量与平均值相关联,并且要求其是单调递增的,连续可微的和可逆的。g

该图允许轻松地从一个方向转到另一个方向,例如:

θ = γ ' - 1- 1η

η=g(γ(θ))
θ=γ1(g1(η))

规范链接功能

使用Momo严格描述的另一种方法是,当是规范链接函数时,则函数组成 是身份,因此我们得到 γ - 1- 1 = γ ' - 1 = θ = ηg

γ1g1=(gγ)1=I
θ=η

1

上面的答案已经涵盖了我想说的内容。为了澄清作为机器学习研究人员的几点:

  1. 链接函数不过是激活函数的逆函数。例如,logit是S形的倒数,probit是高斯累积分布函数的倒数。

  2. 如果我们将广义线性模型的参数仅依赖于,其中为权重向量,为输入,则链接函数称为规范。瓦特XwTxwx

上面的讨论与指数族无关,但是可以在Christopher Bishop的PRML书第4.3.6章中找到很好的讨论。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.