线性回归在统计上显着但具有非常低的r平方是什么意思?


Answers:


27

这意味着您可以解释数据中一小部分的差异。例如,您可以确定大学学位会影响工资,但同时这只是一个很小的因素。还有很多其他因素会影响您的薪水,而且大学学位的贡献很小,但是可以被发现。

在实际应用中,这可能意味着,在平均大专学历通过增加工资$每年500人,而人工资的标准差为$ 10K。因此,许多受过大学教育的人的薪水比未受过教育的人低,并且您的预测模型的价值很低。


11

这意味着“不可减少的误差很高”,即,我们能做的最好的事情(对于线性模型)是有限的。例如,以下数据集:

data=rbind(
cbind(1,1:400),
cbind(2,200:400),
cbind(3,300:400))
plot(data)

注意,此数据集中的技巧是给定一个值,存在太多不同的y值,因此我们无法做出令人满意的预测来满足所有这些值。同时,xy之间存在“强”线性相关。如果我们拟合线性模型,我们将获得显着系数,但R平方低。XÿXÿ

fit=lm(data[,2]~data[,1])
summary(fit)
abline(fit)

Call:
lm(formula = data[, 2] ~ data[, 1])

Residuals:
     Min       1Q   Median       3Q      Max 
-203.331  -59.647   -1.252   68.103  195.669 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  123.910      8.428   14.70   <2e-16 ***
data[, 1]     80.421      4.858   16.56   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 93.9 on 700 degrees of freedom
Multiple R-squared:  0.2814,    Adjusted R-squared:  0.2804 
F-statistic: 274.1 on 1 and 700 DF,  p-value: < 2.2e-16

在此处输入图片说明



3

线性回归在统计上显着但具有非常低的r平方是什么意思?

这意味着自变量和因变量之间存在线性关系,但是这种关系可能不值得一提。

但是,这种关系的意义在很大程度上取决于您要检查的内容,但总的来说,您可以认为它的意义不应该将统计意义与相关性相混淆。

如果样本量足够大,则即使是最琐碎的关系也可以被视为具有统计意义。


1
实际上,线性回归意味着参数中的线性。原始因变量可以进行转换,但您仍然可以进行线性回归。您对统计意义是什么感到有些困惑。对我来说,这意味着参数估计很大。
Michael R. Chernick

重要性是指结果纯粹是偶然的,并且预测变量和因变量之间没有关系的概率。如果样本量较小且结果显着,则可以,参数估计值将很大。但是,对于一个非常大的样本,即使参数估计非常小,您也可以获得明显的结果。尝试一下这里:danielsoper.com/statcalc/calculator.aspx
浮士德

您所说的内容听起来像是关于推断的一般描述。但是,统计显着性是一个特定术语,与超过某个临界值有关,其中临界值取决于分析师选择的特定显着性水平(例如0.05。0.01等)。样本量是另一个因素。在回归中,您要检验几个假设(各个回归系数的意义以及不存在关系的检验。通过在多个可能的模型之间进行选择的逐步过程,也可能会使情况变得复杂。
迈克尔·Chernick

1
统计学既是科学又是艺术,但它基于数学原理。
Michael R. Chernick

2
@MichaelChernik您能详细说明一下吗?我同意浮士德式的观点(实际上我碰巧给出了类似的答案),但我无法理解你的观点。在线性回归中,对显着性(无论是单个回归系数的显着性还是整个回归的显着性)均以无关系(系数正好为0)的假设进行了检验。小(继续)
卡·花旗

2

措辞的另一种方式是,它意味着您可以自信地预测总体水平的变化,而不是个人水平的变化。也就是说,单个数据差异很大,但是当使用足够大的样本时,总体上可以看到潜在的影响。这是一些政府健康建议对个人无益的原因之一。政府有时会觉得有必要采取行动,因为他们可以看到更多的活动导致总体上更多的死亡。他们提出建议或政策来“挽救”这些生命。但是,由于个人反应的差异很大,因此个人不太可能会看到任何好处(或者更糟的是,由于特定的遗传条件,听从相反的建议实际上会改善他们自己的健康,但这隐藏在人口聚集中)。如果个人从“不健康”的活动中获得收益(例如,享乐),则遵循建议可能意味着他们一生都放弃了这种确定的享乐,但实际上并没有亲自改变是否会遭受这种状况的折磨。


很好的例子!
kjetil b halvorsen

我想知道是什么 这项研究[R2
阿克萨卡尔州
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.