如何分辨线性和非线性回归模型之间的区别?


27

我正在阅读有关非线性回归SAS Non Linear的以下链接。通过阅读第一部分“非线性回归与线性回归”,我的理解是下面的方程实际上是线性回归,对吗?如果可以,为什么?

y=b1x3+b2x2+b3x+c

我是否也了解非线性回归中的多重共线性不是问题?我知道多重共线性可能是线性回归中的一个问题,因此,如果上述模型实际上是线性回归,那么肯定会存在多重共线性吗?



Answers:


35

在(至少)三种意义上,回归可以被视为“线性”。 为了区别它们,让我们从一个非常通用的回归模型开始

Y=f(X,θ,ε).

为了使讨论简单,将固定且精确测量的自变量(而不是随机变量)作为固定变量。他们每个属性的观察进行建模,从而产生响应的向量。按照惯例,表示为矩阵,为列向量。(有限矢量)包括参数。 是向量值的随机变量。通常有XnpnYXn×pYnqθεn组件,但有时更少。函数是向量值的(分量与匹配),通常假定函数的后两个参数(和)是连续的。fnYθε

在是数字向量的情况下,将行拟合到数据的原型示例是x值; 是个数的并行向量;给出截距和斜率 ; 和是“随机误差”的向量,其分量是独立的(并且通常假设具有相同但未知的均值零分布)。在前面的符号中(x,y)X(xi,i=1,2,,n)Yn(yi)θ=(α,β)αβε=(ε1,ε2,,εn)

yi=α+βxi+εi=f(X,θ,ε)i

与。θ=(α,β)

回归函数在其三个参数中的任何一个(或全部)中可以是线性的:

  • “线性回归或“线性模型”通常表示是参数线性函数。在这种意义上,“非线性回归”SAS含义是,并假设在第二个变量是可微的。参数(参数):此假设使查找解决方案更加容易。f θf

  • A“之间的线性关系和手段”是线性的函数关系。XYfX

  • 当在为线性时,模型具有加法误差。在这种情况下,始终假定。(否则,将视为“错误”或与“正确”值的“偏差”是不正确的。)fεE(ε)=0ε

这些特征的所有可能组合都可能发生并且很有用。 让我们调查一下可能性。

  1. 具有加性误差的线性关系的线性模型。 这是普通的(多重)回归,上面已经显示过,并且更普遍地写为

    Y=Xθ+ε.

    X如果需要,可以通过邻接一列常量来扩展,并且是向量。θp

  2. 具有加性误差的非线性关系的线性模型。 这可以通过增加的列来表述作为多元回归与非线性函数本身。例如,XX

    yi=α+βxi2+ε

    是这种形式。它在是线性的θ=(α,β) ; 它具有附加误差;并且它是线性的中的值即使X 2 是的非线性函数X (1,xi2)xi2xi

  3. 具有非累加误差的线性关系的线性模型。 一个例子是乘法误差,

    yi=(α+βxi)εi.

    (在这种情况下,可以解释为“乘法错误”时的位置ε 1然而,位置的正确感觉是不一定的期望。Ëε 了:这可能是中位数或例如,几何平均数。在所有其他非加性误差情况下,比照适用于位置假设的类似注释也适用。)εiεi1E(εi)

  4. 具有非累加误差的非线性关系的线性模型。 例如

    yi=(α+βxi2)εi.
  5. 具有加性误差的线性关系的非线性模型。 非线性模型涉及其参数的组合,这些参数不仅是非线性的,甚至无法通过重新表达参数来线性化。

    • 作为非示例,请考虑

      yi=αβ+β2xi+εi.

      通过定义β ' = β 2,和限制β '0,这种模式可被重写α=αββ=β2β0

      yi=α+βxi+εi,

      将其展示为线性模型(具有与附加误差的线性关系)。

    • 作为一个例子,考虑

      yi=α+α2xi+εi.

      不可能找到依赖于α的新参数,该参数会将其线性化为α 的函数(同时在x i中也保持线性)。αααxi

  6. 具有加性误差的非线性关系的非线性模型。

    yi=α+α2xi2+εi.
  7. 具有非累加误差的线性关系的非线性模型。

    yi=(α+α2xi)εi.
  8. 具有非累加误差的非线性关系的非线性模型。

    yi=(α+α2xi2)εi.

尽管它们表现出八种不同的回归形式,但它们不能构成分类系统,因为某些形式可以转换为其他形式。一个标准示例是具有非加性误差的线性模型的转换(假设具有正支持)

yi=(α+βxi)εi

成可经由对数与添加剂误差的非线性关系的线性模型,

log(yi)=μi+log(α+βxi)+(log(εi)μi)

这里,日志几何平均值已经从误差项移除(以确保它们具有零种手段,根据需要),并纳入其它术语(其中它的值将需要估计)。确实,重新表达因变量Y的一个主要原因是创建一个具有加法误差的模型。重新表达还可以根据参数和解释变量(或两者)的函数线性化Y。μi=E(log(εi))YY


共线性

(在中的列向量的)共线性任何形式的回归中可能是一个问题。理解这一点的关键是要认识到共线性会导致估计参数时遇到困难。抽象且相当普遍地,比较两个模型Y = f X θ ε Y = f X 'θ ε ',其中X 'X,其中一列稍有变化。如果这引起估计的巨大变化XY=f(X,θ,ε)Y=f(X,θ,ε)XX θ ',那么我们显然有问题。出现此问题的一种方法是在线性模型中(在X中为线性)(即,上面的类型(1)或(5)),其中θ的分量与X的列一一对应。。当一列是另一列的非平凡线性组合时,其相应参数的估计值可以是任何实数。这就是这种敏感性的极端例子。θ^θ^XθX

从这一观点出发,应该清楚的是,共线性对于非线性关系的线性模型是一个潜在的问题(无论误差的可加性如何),并且这种共线性的广义概念在任何回归模型中都可能是一个问题。当您有冗余变量时,将难以识别某些参数。


您能推荐一个简洁的介绍性阅读来帮助我更好地理解您提到的线性化问题吗,这是您的示例与第5点中的非示例之间区别的核心。谢谢。
ColorStatistics

@Color我不熟悉。在关于可能变换的可微性的温和假设下,这由偏微分方程(PDE)理论解决。
Whuber

0

您现在应该从区分现实和用来描述它的模型开始

您刚才提到的方程式是多项式方程式(x ^ power),即。非线性...但是您仍然可以使用通用线性模型(使用链接函数)或polynomail回归对其建模,因为参数是线性的(b1,b2,b3,c)

希望有所帮助,但实际上有点粗略:现实/模型


3
由于模型的参数是线性的,因此可以通过普通最小二乘法来估算。
分析师2015年

所以这与参数有关吗?如果我们b3 ^ 2 * x仍然是线性的?
mHelpMe 2015年

0

如果模型的参数是线性的,或者可以转换为参数的线性模型(可线性化),则该模型为线性。线性模型可以对线性或非线性关系建模。让我们扩展其中的每个。

如果模型可以表示为项的和,则模型的参数是线性的,其中每个项可以是常数,也可以是乘以预测变量(X i)的参数:

在此处输入图片说明

请注意,此定义非常狭窄。只有满足此定义的模型才是线性的。其他所有模型都是非线性的。

非线性模型有两种类型的线性模型:

1.非线性关​​系的线性模型

例如,该模型下面的模型的非线性关系(因为的Y相对于X的衍生物1是X的函数1)。通过创建新变量W 1 = X 1 2,并用W 1替换X 1 2来重写方程式,我们得到了一个满足线性模型定义的方程式。

在此处输入图片说明

2.不是立即线性的模型,但可以在变换后变为线性的模型(可线性化)。以下是线性化模型的2个示例:

范例1:

在此处输入图片说明

该模型可能看起来是非线性的,因为它不符合参数线性模型的定义,但是可以将其转换为线性模型,因此它是可线性化/可转换线性的,因此被认为是线性的模型。以下转换将使其线性化。首先以双方的自然对数获得:

在此处输入图片说明

然后进行以下替换:

在此处输入图片说明

获得以下线性模型:

在此处输入图片说明

范例2:

在此处输入图片说明

该模型可能看起来是非线性的,因为它不符合参数线性模型的定义,但是可以将其转换为线性模型,因此它是可线性化/可转换线性的,因此被认为是线性的模型。以下转换将使其线性化。首先以双方的对等获得:

在此处输入图片说明

然后进行以下替换:

在此处输入图片说明

获得以下线性模型:

在此处输入图片说明

任何不是线性的模型(甚至不是通过线性化)都是非线性的。可以这样考虑:如果一个模型不符合线性模型的定义,则它是一个非线性模型,除非可以证明它是可线性化的,这时就可以称为线性模型。

上方的Whuber答案以及此链接中Glen_b的答案将为我的答案添加更多颜色。 非线性与广义线性模型:您如何指称逻辑回归,泊松等回归?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.