扩展逻辑回归以得到0到1之间的结果


9

我有一个回归问题,其中结果不是严格地为0、1,而是包括从0到1的所有实数,包括。Y=[0,0.12,0.31,...,1]

尽管我的问题略有不同,但该问题已经在该线程中进行了讨论。

出于与通常使用逻辑回归相同的原因,我无法使用线性回归。在线性回归中,A)非常大的IVs值会使预测结果偏向1,而B)线性回归的结果不限于0.1的极限。

从我的教科书看这个逻辑成本函数,我认为方程式旨在计算仅当和的值不等于0或1 时,成本才大于0 。

Cost=ylog(h(x))(1y)log(1h(x))
yx

通过修改成本函数来度量所有假设误差是否有可能使用逻辑回归?

Answers:


9

您有几种选择。其中两个可能是:

  1. 如果你改变你的通过物流转型,你可以尝试通过普通最小二乘到转化反应变量拟合的线性回归。Ylog(y1y)
  2. 或者,您可以将原始变量拟合为广义线性模型,并使用逻辑变换作为链接变量,并且的方差和均值之间的关系就好像它是一个二项式变量一样,并通过迭代的加权最小二乘法进行拟合。这基本上与“使用逻辑回归”相同。Y

使用哪种方法取决于错误结构,并且唯一的决定方法是将两者都拟合,并查看哪一个具有最适合模型假设的残差结构。我的怀疑是,他们之间没有太多选择。当然,由于您所说的原因,对于未转换的直线线性回归,这两个选项中的任一个都会有很大的改进。Y


2
(+1)选项2:通常,您通常会估计过度分散并使用它来计算标准误差-一个“准二项式”模型,其中Y的方差和均值之间的关系成比例,而不是与二项式变量。
Scortchi-恢复莫妮卡

@Scortchi:这是glm()R连续响应时的功能family=quasibinomial吗?也就是说,它将使用来估计系数,family=binomial然后在一个额外的步骤中,考虑到过度分散来计算标准误差?如果是,这是否与计算“可靠的标准错误”相同?我有一些适当的数据,我尝试了两个家庭glm; 我得到相同的系数但不同的标准误差。谢谢。
变形虫

1
@amoeba:是的。但是“鲁棒的标准误差”通常意味着使用三明治估计器等。
Scortchi-恢复莫妮卡


0

由于y并非严格为零,或一(如您所说)的成本应始终大于零。因此,我认为您不需要在模型中进行修改。


0

我建议两种替代模型:

如果您的结果(y个变量)是有序的,请尝试有序Probit模型。

如果您的结果(y个变量)没有排序,请尝试使用多项式Lo​​git模型。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.