通常建议使用beta回归(即具有beta分布的GLM,通常是logit链接函数)来处理响应aka因变量,其取值介于0和1之间,例如分数,比率或概率:结果的回归(比率或分数)在0和1之间。
但是,总是声称一旦响应变量至少等于0或1,就不能使用beta回归。如果是这样,则需要使用零/一膨胀的beta模型,或者对响应进行某种转换,等等。:Beta回归比例数据,包括1和0。
我的问题是:β分布的哪个属性阻止β回归处理精确的0和1,为什么?
我猜这是和不支持beta发行版的原因。但是对于所有形状参数和,零和一个都支持beta分布,只有较小的形状参数的分布在一侧或两侧达到无穷大。也许样本数据使得提供最佳拟合的和都将大于。
这是否意味着在某些情况下,即使使用零/ 一,实际上也可以使用beta回归吗?
当然,即使0和1支持beta分布,准确观察0或1的概率也为零。但是观察其他给定可计数值集合的可能性也是如此,所以这不是问题吗?(参见@Glen_b的评论)。
在beta回归的上下文中,beta分布的参数设置不同,但是对于,对于所有,仍应在进行明确定义。