影响函数基本上是一种分析工具,可用于评估删除对统计值的观察结果的效果(或“影响”),而不必重新计算该统计量。它们还可以用于创建渐近方差估计。如果影响力等于则渐近方差为I 2I。I2n
我了解影响功能的方式如下。您有某种理论CDF,用。对于简单的OLS,您可以Fi(y)=Pr(Yi<yi)
其中Φ(Ž)是标准正态CDF,而σ2是误差方差。现在,您可以证明任何统计信息都是该CDF的函数,因此记号S(F)(即F的某些函数)。现在假设我们改变功能˚F由“点点”,以˚F(我)(ž)=(1+ζ)˚F(ž)-ζδ(我)(
Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi−(α+βxi)σ)
Φ(z)σ2S(F)FF其中
δ 我(ż )= 我(ÿ 我 < Ž ),和
ζ = 1F(i)(z)=(1+ζ)F(z)−ζδ(i)(z)δi(z)=I(yi<z)。因此,
F(i)代表删除了第“ i”个数据点的数据的CDF。我们可以做一个泰勒级数的
˚F(我)(ž)约
ζ=0。这给出:
ζ=1n − 1F(我)F(我)(z)ζ= 0
小号[ F(我)(z,ζ)] ≈ 小号[ F(我)(z,0 )] + ζ[ ∂小号[ F(我)(z,ζ)]∂ζ|ζ= 0]
注意所以我们得到:
小号[ ˚F (我)(Ž,ζ)]≈小号[˚F(ż)]+ζ [ ∂ 小号[ ˚F (我)(z ,ζ )]F(我)(z,0 )= F(z)
小号[ F(我)(z,ζ)] ≈ 小号[ F(z)] + ζ[ ∂小号[ F(我)(z,ζ)]∂ζ|ζ= 0]
β
β= 1ñ∑ñj = 1(yĴ- ÿ¯¯¯)(xĴ− x¯¯¯)1个ñ∑ñj = 1(xĴ− x¯¯¯)2
因此,β是两个统计量的函数:X的方差以及X和Y之间的协方差。这两个统计量的CDF表示为:
Ç ø v (X,Y)= ∫(X- μX(F))(是- μÿ(F))dF
v 一个[R (X)= ∫(X- μX(F))2dF
μX= ∫X dF
为了删除第i个观察值,我们将其替换 F→ F(我)= (1 + ζ)F- ζδ(我)
μx (我)= ∫X d[ (1 + ζ)F- ζδ(i)]=μx−ζ(xi−μx)
V一个- [R (X)(我)= ∫(X- μx (我))2dF(我)= ∫(X- μX+ ζ(x一世- μX))2d[ (1 + ζ)F- ζδ(我)]
忽略的方面,并简化我们得到:
V 一[R (X )(我) ≈ V 一[Rζ2
V一个- [R (X)(我)≈ V一个- [R (X)- ζ[(x一世- μX)2− V一个- [R (X)]
Co v (X,Y)(我)≈ ço v (X,Y)- ζ[(x一世- μX)(y一世- μÿ)- Ço v (X,Y)]
β(我)ζ
β(我)(ζ)≈ Ço v (X,Y)- ζ[(x一世- μX)(y一世- μÿ)- Ço v (X,Y)]V一个- [R (X)- ζ[(x一世- μX)2− V一个- [R (X)]
现在,我们可以使用泰勒级数:
β(我)(ζ)≈ β(我)(0 )+ ζ[ ∂β(我)(ζ)∂ζ]ζ= 0
简化后得到:
β(我)(ζ)≈ β- ζ[(x一世- μX)(y一世- μÿ)V一个- [R (X)- β(x一世- μX)2V一个- [R (X)]
μÿμXv 一个[R (X)ζ= 1n − 1
β(我)≈ β− x一世− x¯¯¯n − 1[ y一世- ÿ¯¯¯1个ñ∑ñj = 1(xĴ− x¯¯¯)2- βX一世− x¯¯¯1个ñ∑ñj = 1(xĴ− x¯¯¯)2]
X〜= x − x¯¯¯sX
β(我)≈ β− x一世〜n − 1[ y一世〜sÿsX− x一世〜β]