在线性回归模型中具有“恒定方差”是什么意思?


53

误差项中的“恒定方差”是什么意思?如我所见,我们有一个包含一个因变量和一个自变量的数据。恒定方差是线性回归的假设之一。我想知道同调是什么意思。因为即使我有500行,我也会有一个明显是恒定的方差值。我应该用哪个变量比较方差?

Answers:


34

这意味着当您针对预测值绘制单个误差时,误差预测值的方差应为常数。参见下图中的红色箭头,红线的长度(其方差的代理)相同。

在此处输入图片说明


1
好的了解了。!!但是由于这是一个假设,因此我们不需要在运行模型之前验证该假设。以及为什么我们需要这个假设
Mukul 2013年

2
有些假设只能在模型运行后才能进行测试。计算模型只是数学运算,与解释模型不同。
约翰

6
范围不等于方差企鹅骑士,因此您可能要在这里更新措词。
约翰

4
如果您的方差假设是错误的,则通常意味着标准误差是错误的,任何假设检验都可能得出错误的结论。(一个不同的约翰)
约翰·约翰·

4
我略有不同。我不会说异方差性必然意味着您的beta的标准误是错误的,而是OLS估计器不再是最有效的无偏估计器。也就是说,如果您具有恒定的方差(可能是由于Y的变换),或者如果您准确地考虑了非恒定性(也许通过广义最小二乘估计器),则可以提高功率/精度​​。
gung-恢复莫妮卡

58


ÿ=β0+β1个X+ε哪里 εñ0σε2
β0+β1个Xσε2

σε2Xÿεβ0 β1个 σε2Xσε2

ÿ=β0+β1个X+ε哪里 εñ0FX 哪里 FX=经验值γ0+γ1个X和 γ1个0
XFX X

X。但是,我倾向于认为查看地块是最好的。@Penquin_Knight很好地完成了工作,通过绘制模型的残差来显示常数方差,其中同方差相对于拟合值获得。还可以在原始数据图或比例位置(也称为扩展级别)图中检测到异方差。R通过调用方便地为您绘制后者plot.lm(model, which=2);它是残差绝对值相对于拟合值的平方根较低的曲线有助于叠加。您希望最低的配合平坦,而不是倾斜。

请看下面的图,它们比较了这三种不同类型的图中同方差数据与异方差数据的外观。注意上面两个异方差图的漏斗形状,以及最后一个图中向上倾斜的最低线。

在此处输入图片说明

为了完整起见,这是我用来生成这些数据的代码:

set.seed(5)

N  = 500
b0 = 3
b1 = 0.4

s2 = 5
g1 = 1.5
g2 = 0.015

x        = runif(N, min=0, max=100)
y_homo   = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2            ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))

mod.homo   = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)

1
谢谢,这是非常有帮助的。你也可以解释为什么我们需要这样的假设在深入浅出
穆库尔

5
不客气,@ Mukul。为了使OLS估计量(即默认程序软件用于估计beta)成为估计程序,需要假设均方差(恒定方差),该估计程序将生成beta的采样分布,该采样分布具有所有产生的估计程序中最窄的标准误以真实值为中心的抽样分布。即,OLS估计量必须是最小方差无偏估计量
gung-恢复莫妮卡

5
pp1个-p/ñ

2
@gung在您的注释中,对最小方差无偏估计量短语中的所有单词都使用斜体。我知道,采用异方差性,估算器的效率会降低(方差更大),但也会变得有偏差吗?
user1205901

5
@ user1205901,它仍然没有偏见。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.