如果数据不是线性的,则线性回归会有意义吗?


11

我执行了线性回归,得出了显着结果,但是当我检查散点图的线性时,我不确定数据是否线性。

还有其他方法可以在不检查散点图的情况下测试线性度吗?

如果不是线性回归,线性回归会有意义吗?

[编辑以包括散点图]

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明


3
问题可能有多种解释,也可能有多个答案(但基本上,在所有情况下答案都是肯定的,并且由于您的结果证明,在您的情况下肯定是可能的)。你能显示散点图吗?然后其他人可以理解数据不是线性的意思,并且从某种意义上说,仍然存在重要结果。
Sextus Empiricus

5
有关经典的简单示例集,请参见stats.stackexchange.com/search?q=anscombe+quartet。在stats.stackexchange.com/a/152034/919上,我发布了一种算法,该算法能够构造示例以适合几乎您能想到的任何情况。
ub

当然,即使非线性是线性的,也可以忽略非线性,这会导致应用中的推论受损。例如,如果真正的关系是急剧下降,然后在平,则线性的解释是在所有值上下降了一些平均值,而真正的关系是在整个值上下降得多窄得多的范围内的,并且在剩余范围是或多或少不受影响。线性解释对临床治疗效果或政策支出效果不利。X Y X Y X XYXYXYXX
亚历克西斯

同样:线性回归并不重要,例如,,,,可能有意义,也可能没有,但有一定程度的独立性。H ^ 0β X = Ç ħ 0˚F = Ç ħ 0- [R 2 = C ^H0:β0=cH0:βx=cH0:F=cH0:R2=c
亚历克西斯

感谢您的回复,对于缓慢的回复表示歉意-我已经远离技术了!我对帖子进行了编辑,以包括那些重要回归的散点图。任何有关如何进行的建议将不胜感激。
IntoTheBlue

Answers:


18

当建模为线性模型时,单调非线性关系几乎总是很重要。如果关系是非线性的而不是单调的,则取决于样本。

y=lnxy=x3y=x2y=sinx

x[1,1]y=sinxyx

在此处输入图片说明

x[0,π]在此处输入图片说明


13
+1。但是请注意,正确的术语是“单调的”。“单调”是指重复产生的乏味和乏味。
ub

22
lnxsinx

+1我也建议定义单调的含义。
马克·怀特

谢谢,我已经更新了帖子,其中包括散点图。任何有关如何进行的建议将不胜感激。
IntoTheBlue

(xx¯)2

3

是的,阿克萨卡(Aksakal)是正确的,如果真实关系是非线性的,则线性回归可能很重要。线性回归可以找到一条最适合您数据的线,并简单地测试斜率是否与0显着不同。

在尝试寻找非线性统计测试之前,我建议您先考虑一下要建模的内容。您是否期望两个变量之间存在线性(非线性)关系?您到底想揭示什么?如果假设例如在汽车速度和制动距离之间存在非线性关系是合理的,则可以添加自变量的平方项(或其他变换)。

此外,对数据(散点图​​)进行目视检查是一种非常有效的方法,也是分析中必不可少的第一步。


YX

另外:欢迎来到简历,帕维尔!
亚历克西斯

2
@Alexis你是对的。但是在某些文本中,添加二次项仍然是一种常见的建议,因为它是检查非线性的一种快捷方法(理解没有人暗示这是建模非线性的唯一或第一个方法),所以我不太关心那个段落。
ub

+1 @whuber不幸的是,我遇到了许多研究人员,学生和教职员工,他们在实践中添加了二次项作为检查散点图以外的第一项检查方法,即“如何测试非线性”,而否定结果被解释为“线性就足够了” ”。(二次而言的确是有用的,而且我在自己的研究中使用它们。:)我想我的观点的“快速和肮脏”是那个被教导为容易的东西,成为德严谨为广大科研人员。 ..我认为非参数回归与线性回归一样“容易”,并且是探索的更好工具。
亚历克西斯

@Alexis谢谢。我想你误会了我。我不建议添加平方项以测试非线性,但绝对可以考虑平方项(或其他转换。经济数据通常是对数转换的)。我认为探索性分析和解释性分析之间必须有区别。如果有充分的理由假定平方关系,则需要对此进行检验。您建议的是一种更具探索性的方法。
Pawel '18

-2

我同意阿克萨卡尔(Aksakal)所说的一切。但是对于第一个问题,我认为答案是相关性。相关性度量数据集x和y之间存在线性关系的程度。


2
y=lnx

@gung是的。您认为他的哪些说法不正确?请允许我建议,我理解线性和非线性一词的含义,正如在Aksakal的答案中那样,找到具有精确和非线性关系的变量的例子确实很容易。尽管如此,相关性是线性关系的量度,并且+/- 1的相关性意味着该关系确实是线性的。任何小于此的相关性都意味着该关系是(不完全是)线性的,但可能足够接近。
meh '18

1
OP“执行了线性回归,得出了显着结果”,但散点图暗示这种关系不是线性的。实际上,如果回归只有1个X变量,则回归的p值与相关性也将是相同的。但是,如果尽管存在显着回归,但该关系不是线性的,尽管具有显着相关性,但仍将不是线性的。因此,显着的相关性并不表示该关系是线性的。
gung-恢复莫妮卡

1
r=1r=1r1

1
这听起来可能有些微妙甚至挑剔,但(a)我同意相关性是一种衡量双变量关系线性的方法-毕竟这是一个数学定理-但(b)作为一般命题,我怀疑它可以被认为是评估非线性的一种非常粗略的方法 非线性的证据可能在具有高绝对样本相关性的数据集中引人注目,而在具有绝对绝对小相关性的数据集中则完全没有。(cc @gung)
胡伯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.