我很惊讶没有人提出明显的解决方案:
#generate completely separated data
library(robustbase)
set.seed(123)
x<-rnorm(200)
x[1:40]<-x[1:40]+10
x[41:80]<-x[41:80]-10
Rob<-ltsReg(x~1,nsamp="best")
#all the good guys
which(Rob$raw.weights==1)
现在进行解释:ltsReg
package中的函数robustbase
,当使用option调用时
nsamp="best"
得出单变量(精确的)MCD权重。(这些是存储在$raw.weights
对象中的n矢量0-1权重。识别它们的算法是MCD估计器(1))。
简而言之,对于最集中观察的子集的成员,这些权重为1 。h=⌈(n+2)/2⌉
在维度中的一个,它开始通过排序所有观察然后计算的所有连续的子集的度量意见:表示
的排序观测的向量的条目,它计算的度量
(例如然后
等... ),然后保留较小的尺寸。X (我)我吨ħ(X (1 ),。。。,X (ħ + 1 ))(X (2 ),。。。,X (ħ + 2 ))hx(i)ith
(x(1),...,x(h+1))(x(2),...,x(h+2))
该算法假设您的兴趣组对原始样本进行了严格的编号,并且它具有对称的分布(但对其余观测的分布没有假设
)。n−h
(1)PJ Rousseeuw(1984)。平方回归的最小中位数,美国统计协会杂志。