线性回归中线性代表什么?


11

在R中,如果我写

lm(a ~ b + c + b*c) 

这仍然是线性回归吗?

如何在R中进行其他类型的回归?我希望对教科书或教程有什么建议吗?


我试图重新表达您的问题。恐怕您似乎在问两个非常不同的问题。对于第二个站点,该站点以及CRAN上都有大量资源可用。
chl

@chl,是的,谢谢,我不清楚。我的问题确实是这样的:如果我用R写LM,R是否总是将其理解为线性或试图拟合任何模型,不一定是线性回归而是任何回归?
suprvisr 2011年

不,lm()代表线性回归。您的模型包含,和的三个参数(减去截距)bc它们的相互作用b:c表示b + c + b:cb*c简称(R遵循统计模型的Wilkinson表示法)。通过要求拟合通用线性模型(即,链接函数不是同一性,如上面表示的线性模型的情况)glm()
chl

Answers:


24

线性是指您要估计的参数(例如)和结果(例如)之间的关系。因此,是线性的,但是不是线性的。线性模型意味着可以参数矢量的估计写为,其中是由估算过程确定的权重。线性模型可以以封闭形式代数求解,而许多非线性模型则需要使用计算机通过数值最大化来求解。βyiy=exβ+ϵy=eβx+ϵβ^=iwiyi{wi}


6
+1具体来说,在“线性模型”中,因变量是参数的线性函数,但不一定是数据的线性函数。y
ub

第一个是线性的吗?真的-x的幂?
suprvisr 2011年

2
是的,因为不是感兴趣的数量(您优化的数量),而是是。因此,它在是线性的。xββ
bayerj 2011年

+1,但是可以通过评论问题中的公式来改善此答案。
naught101

1
在二读时,我注意到该答复的后半部分使“线性模型”与“线性估计器”混淆。这两个概念是不同的。非线性模型通常具有线性估计量,线性模型可以具有非线性估计量(例如,考虑GLM)。
whuber

5

minitab.com上的这篇帖子提供了非常明确的解释:

  • 可以使用以下格式编写的模型是线性的:
    • Response = constant + parameter * predictor + ... + parameter * predictor
      • 也就是说,当每个术语(模型中的)都是常数或参数与预测变量的乘积时。
    • 因此,这两种这些都是线性模型:
      • Y=B0+B1X1(这是一条直线)
      • Y=B0+B1X12 (这是一条曲线)
  • 如果无法使用上述格式表示模型,则为非线性。
    • 非线性模型的示例:
      • Y=B0+X1B1
      • Y=B0cos(B1X1)

4

在将其作为“ R线性回归”问题而不是“线性回归”问题时,我会非常谨慎。R中的公式具有您可能知道或可能不知道的规则。例如:

http://wiener.math.csi.cuny.edu/st/stRmanual/ModelFormula.html

假设您要询问以下方程式是否为线性:

a = coeff0 + (coeff1 * b) + (coeff2 * c) + (coeff3 * (b*c))

如果您汇编一个新的自变量,则答案是肯定的,例如:

newv = b * c

将上面的newv方程替换为原始方程可能看起来像您对线性方程的期望:

a = coeff0 + (coeff1 * b) + (coeff2 * c) + (coeff3 * newv)

就引用而言,Google可以进行“ r回归”,或者您认为可能适用的任何方法。


重命名如何使其线性化?我不明白,如果恒等式newv = b * c成立,那么它根本不是线性的。我很困惑。
bayerj 2011年

@bayer:newv是一个新变量。新方程是三个变量(b,c,newv)的线性函数,其中系数提供线性关系。这两个方程都不是两个变量的线性组合。
bill_080 2011年

@bayer请参阅@Charlie的回复。在本示例中,两个模型都是线性的(无论R是否这样看),因为两个模型都是a四个系数的线性函数。
Whuber

谢谢,这很有道理...我可以简单地为数据库中的每种情况添加新变量neww为b * c(医学),然后将其视为线性回归吗?
suprvisr 2011年

2

您可以将线性回归写为(线性)矩阵方程。

[a1a2a3a4a5...an]=[b1c1b1c1b2c2b2c2b3c3b3c3b4c4b4c4b5c5b5c5...bncnbncn]×[αbαcαbc]+[ϵ1ϵ2ϵ3ϵ4ϵ5...ϵn]

或者,如果您将此折叠起来:

a=αbb+αcc+αbcbc+ϵ

这个线性回归等价于寻找线性矢量的组合,和最接近向量。bcbca

(这也是一种几何解释,即在向量,和的跨度上找到的投影。对于具有两个列向量的问题通过三个测量,仍然可以将其绘制为一个数字,例如,如下所示:http : //www.math.brown.edu/~banchoff/gc/linalg/linalg.htmlb c b cabcbc


理解此概念在非线性回归中也很重要。例如,解决 比容易得多,因为第一个参数化允许用线性回归技术求解和系数。 y = u e c t - v + e d t - v a by=aect+bedty=u(ec(tv)+ed(tv))ab


我觉得这是最好的答案,因为它回答了问题“为什么”而不是“什么”。用“什么”回答并不能带来更好的直觉。
Hexatonic
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.