几年前,我为我的学生(西班牙语)写了一篇有关此的论文,因此我可以尝试在这里重写这些解释。我将通过一系列增加复杂性的示例来研究IRLS(迭代加权最小二乘)。对于第一个示例,我们需要一个位置比例系列的概念。在某种意义上,令为以零为中心的密度函数。我们可以通过定义f (x )= f (x ; μ ,σ )= 1来构造一个密度族
F0
,其中σ>0是比例参数,μ是位置参数。在测量误差模型中,通常将误差项建模为正态分布,我们可以代替正态分布使用上面构建的位置比例系列。当f0是标准正态分布时,上述结构给出N(μ,σ)族。
F(x )= f(x ; μ ,σ)= 1σF0(X - μσ)
σ> 0μF0N (μ ,σ)
现在,我们将在一些简单示例上使用IRLS。首先,我们将在模型Y 1,Y 2,... ,Y n中找到ML(最大似然)估计量
密度
f (y )= 1的 iid
ÿ1个,Y2,… ,Yñ艾德
柯西分布位置的家庭
μ(因此这是一个位置家族)。但是首先是一些符号。
μ的加权最小二乘估计值由
μ ∗ = ∑ n i = 1 w i y i给出F(y)= 1π1个1 + (y- μ )2,ÿ∈ [R ,
μμ
其中,
w ^我是一些权重。我们将看到的ML估计
μ可以以相同的形式来表达,
w ^我残差的某个函数
ε我=Ÿ我 - μ。
似然函数由
L(y;μ)=(1μ∗= ∑ñ我= 1w一世ÿ一世∑ñ我= 1w一世。
w一世μwiϵi=yi−μ^.
和对数似然函数由下式给出
升(Ý)=-ñ日志(π)- ñ Σ我=1个日志(1+(Ý我-μ)2)。
其相对于衍生物
μ是
∂ 升(Ý )L(y;μ)=(1π)n∏i=1n11+(yi−μ)2
l(y)=−nlog(π)−∑i=1nlog(1+(yi−μ)2).
μ
其中
ε我=ÿ我-μ。写
f0(ϵ)=1∂l(y)∂μ===0−∑∂∂μlog(1+(yi−μ)2)−∑2(yi−μ)1+(yi−μ)2⋅(−1)∑2ϵi1+ϵ2i
ϵi=yi−μ和
˚F ' 0(ε)=1f0(ϵ)=1π11+ϵ2,我们得到
˚F ' 0(ε)f′0(ϵ)=1π−1⋅2ϵ(1+ϵ2)2
我们发现
∂ 升(ÿ )f′0(ϵ)f0(ϵ)=−1⋅2ϵ(1+ϵ2)211+ϵ2=−2ϵ1+ϵ2.
在这里我们使用的定义
瓦特我= ˚F ' 0( ε 我)∂l(y)∂μ===−∑f′0(ϵi)f0(ϵi)−∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)⋅(−ϵi)∑wiϵi
记住的是,
ε我=ÿ我-μ我们得到方程
Σ瓦特我Ŷ我=μΣ瓦特我,
这是IRLS的估计方程。注意
wi=f′0(ϵi)f0(ϵi)⋅(−1ϵi)=−2ϵi1+ϵ2i⋅(−1ϵi)=21+ϵ2i.
ϵi=yi−μ∑wiyi=μ∑wi,
- 权重始终为正。wi
- 如果残差很大,我们将给予较少的权重。
μ^(0)
ϵ(0)i=yi−μ^(0)
w(0)i=21+ϵ(0)i.
μ^μ^(1)=∑w(0)iyi∑w(0)i.
ϵ(j)i=yi−μ^(j)
w(j)i=21+ϵ(j)i.
j+1μ^(j+1)=∑w(j)iyi∑w(j)i.
μ^(0),μ^(1),…,μ^(j),…
现在,我们使用更一般的位置和比例尺族研究此过程f(y)=1σf0(y−μσ)Y1,Y2,…,Ynϵi=yi−μσ
l(y)=−n2log(σ2)+∑log(f0(yi−μσ)).
ν=σ2∂ϵi∂μ=−1σ
∂ϵi∂ν=(yi−μ)(1ν−−√)′=(yi−μ)⋅−12σ3.
∂l(y)∂μ=∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂μ=∑f′0(ϵi)f0(ϵi)⋅(−1σ)=−1σ∑f′o(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)=1σ∑wiϵi
σ2∂l(y)∂ν=====−n21ν+∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂ν−n21ν+∑f′0(ϵi)f0(ϵi)⋅(−(yi−μ)2σ3)−n21ν−121σ2∑f′0(ϵi)f0(ϵi)⋅ϵi−n21ν−121ν∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)⋅ϵi−n21ν+121ν∑wiϵ2i=!0.
σ2^=1n∑wi(yi−μ^)2.
在下面,我们为双指数模型(已知比例)和数据使用R给出数值示例y <- c(-5,-1,0,1,5)
。对于此数据,ML估计量的真实值为0。初始值为mu <- 0.5
。算法的一遍是
iterest <- function(y, mu) {
w <- 1/abs(y-mu)
weighted.mean(y,w)
}
使用此功能,您可以尝试“手动”进行迭代,然后可以通过以下方式完成迭代算法:
mu_0 <- 0.5
repeat {mu <- iterest(y,mu_0)
if (abs(mu_0 - mu) < 0.000001) break
mu_0 <- mu }
tkσ
wi=k+1k+ϵ2i.
w(ϵ)=1−eϵ1+eϵ⋅−1ϵ.
目前,我将其保留在此处,我将继续发布该帖子。