Answers:
有几种。您可以在此链接中找到与本文件的未修饰版本的详尽比较 (此答案底部的正确参考)。
由于问题的限制,这些算法中最强大的算法(L / RMC)的故障最多为12.5%。L / RMC的一个优点是它基于分位数,即使基础分布没有时间,它仍然可以解释。另一个优点是,它不假设数据的未污染部分分布的对称性来测量尾巴重量:实际上,该算法返回两个数字:用于右尾巴重量的RMC和用于左尾巴重量的LMC。
通过构造:例如,没有任何污染会导致算法返回-1!)。在实践中,人们发现一个人甚至可以用非常病理性的异常值代替大约5%的样本,而不会导致估计数的最大影响(总是有两个)与未受污染的样本的价值相差太大。
L / RMC也得到广泛实施。例如,您可以在此处找到R实现 。如上面链接的文章中所述,要计算L / RMC,您需要分别在数据的左半部分和右半部分计算MC(在链接中实现的估算器)。在此,(左)右半部分是由观测值(小于)大于原始样本的中位数形成的子样本。