为什么截距的标准


13

截距项的标准误差(β 0)在Ŷ = β 1 X + β 0 + ε由下式给出小号È β 0 2 = σ 2 [ 1β^0y=β1x+β0+ε 其中ˉX是平均的X的。

SE(β^0)2=σ2[1n+x¯2i=1n(xix¯)2]
x¯xi

据我了解,在SE量化你的uncertainty-例如,在样本的95%,区间将包含真实β 0。我不明白的SE,不确定性的度量,如何与增加ˉ X。如果我只是转移我的数据,使ˉ X = 0,我的不确定性下降?那似乎是不合理的。[β^02SE,β^0+2SE]β0x¯x¯=0

类似的解释是-在我的数据的非中心版本对应于我的预测在X = 0,而在中心的数据β 0对应于我的预测在X = ˉ X。那么,这是否意味着,然后我讲我在预测的不确定性X = 0比我对我的预测在不确定性较大的X = ˉ X?这似乎也是不合理的,对于所有x值,误差ϵ具有相同的方差β^0x=0β^0x=x¯x=0x=x¯ϵx,所以我对所有预测值的不确定性都应该相同。x

我敢肯定,我的理解存在差距。有人可以帮助我了解发生了什么吗?


3
你有没有根据日期退货?许多计算机系统的起始日期都在遥远的过去,通常是100多年或2000年前。截距估计向后推断到该开始时间的数据值。根据一系列21世纪数据的回归,您如何确定0 CE年伊拉克的国内生产总值?
ub

我同意,如果您这样考虑,这是有道理的。这和龚的回答很清楚。
elexhobby14年

2
这个答案给出了它是如何产生一个直观的解释说明,以图),铸造拟合线的配合,在方面的平均(拟合线穿过ˉ Xˉ ÿ),并说明为什么的位置在那里,当您移动远离该线可以去展开ˉ X(这是由在斜坡的不确定性引起的)。x¯(x¯,y¯)x¯
Glen_b-恢复莫妮卡2014年

Answers:


16

由于回归拟合线通过普通最小二乘必然经历的平均数据(即,) -至少,只要你做对的真正价值无法抑制拦截不确定性斜率具有平均值的上线的垂直位置没有影响X(即,在ÿ ˉ X)。这相当于少垂直的不确定性在ˉ X比你从更远ˉ X你。如果截距,其中X = 0ˉ X(x¯,y¯)xy^x¯x¯x¯x=0x¯,那么这将最大限度地减少你对真正价值的不确定性。在数学方面,这转化为标准误差的最小可能值β 0β0β^0

这是一个简单的例子R

set.seed(1)                           # this makes the example exactly reproducible
x0      = rnorm(20, mean=0, sd=1)     # the mean of x varies from 0 to 10
x5      = rnorm(20, mean=5, sd=1)
x10     = rnorm(20, mean=10, sd=1)
y0      = 5 + 1*x0  + rnorm(20)       # all data come from the same  
y5      = 5 + 1*x5  + rnorm(20)       #  data generating process
y10     = 5 + 1*x10 + rnorm(20)
model0  = lm(y0~x0)                   # all models are fit the same way
model5  = lm(y5~x5)
model10 = lm(y10~x10)

在此处输入图片说明

x0(x¯,y¯)y^x¯SE(β^0)x=10x=0


yxxnew


x=xxx¯=0x¯=x

(xx¯)2x¯2

@elexhobby,我添加了一些信息来回答您的评论,您可能还希望查看链接的材料。让我知道您是否还需要更多。
gung-恢复莫妮卡

SE(β^1)=σ2(xix¯)2xnewSE(β^1)(xnewx¯)2σ2nβ^1β^0σ2n+σ2(xnewx¯)2(xix¯)2

1
σ2ny¯x=x¯y¯nσ2n
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.