GLM中有多少个分布?


11

我在教科书中确定了多个位置,其中用5种分布(即Gamma,Gaussian,Binomial,Inverse Gaussian和Poisson)描述了GLM。R中的族函数也对此进行了举例说明。

有时,我会遇到对GLM的引用,其中包括其他发行版(示例)。有人可以解释为什么这5个特殊或始终在GLM中出现,但有时其他情况如此吗?

根据我到目前为止的了解,指数族中的GLM分布都适合以下形式: 其中是色散参数,而是规范参数。φθ

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

不能对任何发行版进行转换以使其适合GLM吗?


5
显然,均匀分布不属于指数族。
詹雄2015年

好问题。例如,对数正态如何?
Michael M

1
@詹雄,统一不是beta分布的特例,并且beta分布在指数族中吗?
shf8888

@ shf8888 AFAIK当收敛到伽马分布时,它只是极限中的指数族分布。
Shadowtalker

@詹雄,感谢您的澄清!道歉,没错,界限未知,并不是指数分布。
shf8888

Answers:


4

正如您所指出的,在GLM中使用分布的条件是它属于指数族(请注意:这与指数分布一样!尽管指数分布(作为伽马分布)本身就是指数分布的一部分。指数族)。您列出的五个发行版都是这个家族的,更重要的是,它们是非常常见的发行版,因此将它们用作示例和解释。

正如詹雄所言,均匀分布(边界未知)是非指数族分布的经典示例。shf8888使任何间隔的一般均匀分布与Uniform(0,1)混淆。Uniform(0,1)分布是beta分布的特例,它一个指数族。其他非指数族分布是混合模型和t分布。

您已经正确定义了指数族,并且规范参数对于使用GLM非常重要。尽管如此,我总是发现将指数族写为:

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

有一个更通用的写法,用向量代替标量;但是一维情况说明了很多。具体来说,您必须能够将密度的非指数部分分解为两个函数,一个是未知参数但没有观测到的数据,另一个是而非;取幂部分也是如此。可能很难看到如何以这种方式编写二项式分布。但是随着一些代数的杂耍,它最终变得清晰起来。θ θ X X θθθθxxθ

我们使用指数族是因为它使许多事情变得容易得多:例如,找到足够的统计数据并检验假设。在GLM中,规范参数通常用于查找链接函数。最后,有关统计学家为何倾向于在几乎所有情况下都使用指数族的一个相关说明,它试图对Uniform(,)分布(其中和都未知)进行经典统计推断。这不是不可能的,但是它比指数分布的家庭要复杂和复杂得多。θ 2 θ 1 θ 2θ1θ2θ1θ2


两个参数都未知的Beta分布仍然是指数族(但是2参数指数族)。是什么让您认为不是?www2.stat.duke.edu/courses/Spring11/sta114/lec/…或维基百科
DavidR

感谢您指出这一点,我更改了评论...您是对的!我真的不明白我的意思
亨利
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.