线性回归和逻辑回归之间有什么区别?
您什么时候使用?
线性回归和逻辑回归之间有什么区别?
您什么时候使用?
Answers:
线性回归使用一般线性方程其中是连续因变量和自变量是通常连续的(但是当线性模型在叔使用也可以是二元的,例如测试)或其他离散域。是模型未解释的方差术语,通常仅称为“错误”。可以通过稍微修改等式来解决由表示的各个相关值:Y X i ϵ Y j Y j = b 0 + ∑ (b i X i j)+ ϵ j
Logistic回归是另一种使用相同基本公式的广义线性模型(GLM)程序,但它不是连续而是针对分类结果的概率进行回归。以最简单的形式,这意味着我们只考虑一个结果变量和该变量的两个状态-0或1。
的概率方程如下: P (Y = 1 )= 1
您的自变量可以是连续的或二进制的。可以对回归系数取幂,以得出每变化一次几率变化,即,和。 被称为赔率,。用英语讲,您可以说的几率在每单位变化增加倍。b i Y X i O d d s = P (Y = 1 ) Δødd小号=Ëb我Δödd小号ödd小号(X我+1) Y=1ebiXi
示例:如果您想查看体重指数如何预测血液胆固醇(一种连续测量),则可以使用我的答案顶部所述的线性回归。如果您想了解BMI如何预测成为糖尿病(二元诊断)的几率,则可以使用逻辑回归。
线性回归用于建立因变量和自变量之间的关系,这在估计自变量发生变化时可用于估计结果因变量。例如:
使用线性回归,发现Rain(R)与雨伞销量(U)之间的关系为-U = 2R + 5000
这个方程式表明,每1mm的雨量,就需要5002把雨伞。因此,使用简单回归,您可以估算变量的值。
另一方面,逻辑回归用于确定事件的概率。并且此事件以二进制格式(即0或1)捕获。
示例-我想确定客户是否会购买我的产品。为此,我将对(相关)数据运行Logistic回归,而我的因变量将是一个二进制变量(1 =是; 0 =否)。
在图形表示方面,一旦将值绘制在图形上,线性回归就会给出一条线性线作为输出。而Logistic回归给出了S型线
来自Mohit Khurana的参考。
差异已由DocBuckets和Pardis解决,但我想添加一种比较未提及的性能的方法。
线性回归通常通过最小化模型对数据的最小二乘误差来解决,因此对大误差进行二次惩罚。Logistic回归正好相反。使用逻辑损失函数会导致将较大的误差惩罚为渐近常数。
考虑对分类的{0,1}结果进行线性回归,以了解为什么这是一个问题。如果您的模型在真值为1时预测结果为38,那么您什么也不会损失。线性回归将尝试减少38,而后勤则不会(尽可能)。