为什么beta回归不能在响应变量中正确处理0和1?


17

通常建议使用beta回归(即具有beta分布的GLM,通常是logit链接函数)来处理响应aka因变量,其取值介于0和1之间,例如分数,比率或概率:结果的回归(比率或分数)在0和1之间

但是,总是声称一旦响应变量至少等于0或1,就不能使用beta回归。如果是这样,则需要使用零/一膨胀的beta模型,或者对响应进行某种转换,等等。:Beta回归比例数据,包括1和0

我的问题是:β分布的哪个属性阻止β回归处理精确的0和1,为什么?

我猜这是和不支持beta发行版的原因。但是对于所有形状参数和,零和一个支持beta分布,只有较小的形状参数的分布在一侧或两侧达到无穷大。也许样本数据使得提供最佳拟合的和都将大于。01α>1β>1αβ1

这是否意味着在某些情况下,即使使用零/ 一,实际上也可以使用beta回归吗?

当然,即使0和1支持beta分布,准确观察0或1的概率也为零。但是观察其他给定可计数值集合的可能性也是如此,所以这不是问题吗?(参见@Glen_b的评论)。

Beta分布

在beta回归的上下文中,beta分布的参数设置不同,但是对于,对于所有,仍应在进行明确定义。ϕ=α+β>2[0,1]μ

在此处输入图片说明


2
有趣的问题!除了凯文·赖特(Kevin Wright)提出的观点之外,我没有其他答案。我猜想概率中的精确零和一是病理情况(例如在逻辑回归中),因此没有那么有趣,因为它们不应该发生。
蒂姆

1
@Tim好吧,我不知道它们是否应该发生,但它们确实会经常发生,否则人们不会问如何在beta回归中处理0和1的问题,不会写关于0-的论文和1膨胀的beta模型等。无论如何,我仍然希望比Kevin的答案更详细。人们至少应该解释一下对数似然中这些术语是如何产生的。
变形虫说莫妮卡(Reonica Monica)

1
更新:这可能是因为如果支持0和1,则这些点的PDF等于零,这意味着观察这些值的可能性为零。我仍然希望看到一个仔细解释此问题的答案。
变形虫说莫妮卡(Reonica)Monica

因此,当响应变量采用值时,然后应该使用哪种分布?[0,)
混淆了

Answers:


16

因为对数可能性同时包含log 1 - x ,它们在x = 0x = 1时是无界的。参见Smithson&Verkuilen的公式(4),“ 更好的柠檬榨汁机?使用Beta分布因变量的最大似然回归 ”(直接链接至PDF)。log(x)log(1x)x=0x=1


3
谢谢。这是论文的直接PDF链接。我可以看到 (4)会在y i = 1时分解,但我仍然不明白为什么这会在一般事物中发生。yi=0yi=1
变形虫说莫妮卡(Reonica)Monica

3
(+1)变形虫,只看pdf:对于每个 Beta分布,1处的密度都是0+ 。在任何一种情况下,对数似然将是不确定的。等效地,一旦出现单个01响应,所有可能性的值就只能是零,无穷大或不确定,并且将存在一组非平凡的Beta参数,对于这些参数,实现了可能性的最小值。因此,排除了实际计算,并且该模型无法识别(严重意义上)。010+01
ub

1
连同@whuber的评论(直到现在我才注意到),这确实可以回答问题。要点是,对于我所询问的参数值,1的似然率为零。01
变形虫说莫妮卡(Reonica Monica)

1
@whuber我感到困惑的原因是,观察到概率为零,但观察到的概率也为零,例如0.5(具体来说,让β等于α = β = 2)。尽管如此,0.5与模型相一致,但0是没有了,这是因为可能观察到的0.5是不是零,而是观察的可能性0是...00.5α=β=20.500.50
阿米巴恢复莫妮卡说,

3
@amoeba可能性取决于概率密度,而不是概率本身。有时,可以通过考虑每个观测值包括一个微小但有限(而非无限小)间隔的概率(例如,由测量精度确定)来避免该问题,或者通过将Beta分布与非常窄的高斯卷积(消除了零密度和无限密度)。
whuber

2

除了其原因来自于实践,从存在的事实Ô g ^ 1 - X ,我会尽量陷害为什么出现这种情况的根本原因答案补充的问题。log(x)log(1x)

实际上,β分布“通常用于描述概率值的分布”(维基百科)。它是二项式分布的可能趋势的分布,已知观察到随机变量的N个独立二元绘制。pN

结果,按照我对Beta回归的理解,0和1将直观地对应于(无限)确定的结果。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.