影响功能和OLS


15

我试图了解影响功能是如何工作的。有人可以在简单的OLS回归中解释吗

ÿ一世=α+βX一世+ε一世

在这里我想影响作用β


2
这里还没有一个具体问题:您是否想看看影响函数是如何计算的?您是否需要一个具体的经验示例?含义的启发式解释?
ub

1
如果您查阅弗兰克·克里奇利(Frank Critchley)在1986年发表的论文“主要成分中的影响函数”(不记得该论文的确切名称)。他在此处定义了用于普通回归的影响函数(可能会也可能不会证明我的答案是错误的)。
概率

Answers:


15

影响函数基本上是一种分析工具,可用于评估删除对统计值的观察结果的效果(或“影响”),而不必重新计算该统计量。它们还可以用于创建渐近方差估计。如果影响力等于则渐近方差为I 2II2n

我了解影响功能的方式如下。您有某种理论CDF,用。对于简单的OLS,您可以Fi(y)=Pr(Yi<yi)

其中ΦŽ是标准正态CDF,而σ2是误差方差。现在,您可以证明任何统计信息都是该CDF的函数,因此记号SF(即F的某些函数)。现在假设我们改变功能˚F由“点点”,以˚Fž=1+ζ˚Fž-ζδ

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Φ(z)σ2S(F)FF其中 δ ż = ÿ < Ž ,和 ζ = 1F一世ž=1个+ζFž-ζδ一世žδ一世ž=一世ÿ一世<ž。因此,Fi代表删除了第“ i”个数据点的数据的CDF。我们可以做一个泰勒级数的˚Fžζ=0。这给出:ζ=1个ñ-1个F一世F一世žζ=0

小号[F一世žζ]小号[F一世ž0]+ζ[小号[F一世žζ]ζ|ζ=0]

注意所以我们得到: 小号[ ˚F Žζ]小号[˚Fż]+ζ [ 小号[ ˚F z ζ ]F一世ž0=Fž

小号[F一世žζ]小号[Fž]+ζ[小号[F一世žζ]ζ|ζ=0]

β

β=1个ñĴ=1个ñÿĴ-ÿ¯XĴ-X¯1个ñĴ=1个ñXĴ-X¯2

因此,β是两个统计量的函数:X的方差以及X和Y之间的协方差。这两个统计量的CDF表示为:

CØvXÿ=X-μXFÿ-μÿFdF
v一种[RX=X-μXF2dF
μX=XdF

为了删除第i个观察值,我们将其替换 FF一世=1个+ζF-ζδ一世

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx
V一种[RX一世=X-μX一世2dF一世=X-μX+ζX一世-μX2d[1个+ζF-ζδ一世]

忽略的方面,并简化我们得到: V [R X V [Rζ2

V一种[RX一世V一种[RX-ζ[X一世-μX2-V一种[RX]
CØvXÿ一世CØvXÿ-ζ[X一世-μXÿ一世-μÿ-CØvXÿ]

β一世ζ

β一世ζCØvXÿ-ζ[X一世-μXÿ一世-μÿ-CØvXÿ]V一种[RX-ζ[X一世-μX2-V一种[RX]

现在,我们可以使用泰勒级数:

β一世ζβ一世0+ζ[β一世ζζ]ζ=0

简化后得到:

β一世ζβ-ζ[X一世-μXÿ一世-μÿV一种[RX-βX一世-μX2V一种[RX]

μÿμXv一种[RXζ=1个ñ-1个

β一世β-X一世-X¯ñ-1个[ÿ一世-ÿ¯1个ñĴ=1个ñXĴ-X¯2-βX一世-X¯1个ñĴ=1个ñXĴ-X¯2]

X=X-X¯sX

β一世β-X一世ñ-1个[ÿ一世sÿsX-X一世β]

那么故事是关于附加数据点的影响的?我更习惯于时间序列数据的脉冲响应,在统计方面,所有影响都将通过边际效应或标准化回归中的(更好选择)β系数来描述。好吧,我确实需要更多上下文来判断问题和答案,但是我认为这一点很好((还没有+1,但正在等待)。
Dmitrij Celov 2011年

@dmitrij-这是从链接中隐含的(或我推断的)-它与统计的鲁棒性有关。影响函数比1个数据点更通用-您可以将增量函数重新定义为它们的总和(如此多的观察值)。我会在某种程度上将其视为“廉价的折磨”-因为您不需要重新拟合模型。
概率

10

这是讨论回归影响函数的一种超级通用的方法。首先,我将介绍一种表达影响力的方法:

FΣFϵX

FϵX=1个-ϵF+ϵδX
δXΣ{X}Σ

由此我们可以很容易地定义影响函数:

θ^Fψ一世XΓ

ψθ^FX=ϵ0θ^FϵX-θ^Fϵ

θ^FδX

OLS估计值可以解决此问题:

θ^=精氨酸θË[ÿ-XθŤÿ-Xθ]

想象一个受污染的分布,它使观测值更大Xÿ

θ^ϵ=精氨酸θ1个-ϵË[ÿ-XθŤÿ-Xθ]+ϵÿ-XθŤÿ-Xθ

采取一阶条件:

{1个-ϵË[XŤX]+ϵXŤX}θ^ϵ=1个-ϵË[XŤÿ]+ϵXŤÿ

由于影响函数只是Gateaux的导数,我们现在可以说:

-Ë[XŤX]+XŤXθ^ϵ+Ë[XŤX]ψθXÿ=-Ë[XŤÿ]+XŤÿ

ϵ=0θ^ϵ=θ^=Ë[XŤX]-1个Ë[XŤÿ]

ψθXÿ=Ë[XŤX]-1个XŤÿ-Xθ

此影响函数的有限样本对应项是:

ψθXÿ=1个ñ一世X一世ŤX一世-1个XŤÿ-Xθ

总的来说,我发现此框架(将影响力功能用作Gateaux衍生物)更易于处理。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.