对峰度的可靠估计?


11

我使用的是峰度的常用估计量,,但是我注意到经验分布中即使是很小的“离群值” ,即远离中心的小峰,对其产生巨大影响。是否有一个更稳健的峰度估计器?

ķ^=μ^4σ^4

Answers:


8

有几种。您可以在此链接中找到与本文件的未修饰版本的详尽比较 (此答案底部的正确参考)。

由于问题的限制,这些算法中最强大的算法(L / RMC)的故障最多为12.5%。L / RMC的一个优点是它基于分位数,即使基础分布没有时间,它仍然可以解释。另一个优点是,它不假设数据的未污染部分分布的对称性来测量尾巴重量:实际上,该算法返回两个数字:用于右尾巴重量的RMC和​​用于左尾巴重量的LMC。

[01个]通过构造:例如,没有任何污染会导致算法返回-1!)。在实践中,人们发现一个人甚至可以用非常病理性的异常值代替大约5%的样本,而不会导致估计数的最大影响(总是有两个)与未受污染的样本的价值相差太大。

L / RMC也得到广泛实施。例如,您可以在此处找到R实现 。如上面链接的文章中所述,要计算L / RMC,您需要分别在数据的左半部分和右半部分计算MC(在链接中实现的估算器)。在此,(左)右半部分是由观测值(小于)大于原始样本的中位数形成的子样本。

  • Brys,Hubert,Struyf。(2006)。尾部重量的稳健措施。

2
这些不是说尾巴重量的替代测量方法,而是说不是强有力的峰度估算器吗?这可能是他真正想要的。但这不完全是他的要求。所有这些估计量中的任何一个/全部都收敛到峰度吗?
andrewH 2015年

本文摘要:在满足Van Zwet凸序的条件的无污染数据下(峰度的度量有意义),它们收敛到峰度的单调函数。
user603 2015年

1
皮尔森峰度测量的是简单明了的异常值(罕见的极端观察)。那么,您在寻找什么呢?衡量“言语”的标准?首先,这根本不是皮尔逊峰度所能测量的。其次,如果要度量“口头表达”,则首先必须定义其含义。如果可以定义,则可以对其进行估计。一种可能性是标准化数据pdf的二阶导数,在峰值时进行评估。(别客气)。我敢肯定还有其他人。
彼得·韦斯特伦

1
实际上,我给出了三个将峰度与分布的尾部相关联的数学定理,因此不能作假:(i)对于所有具有有限第四矩的分布,峰度在E(Z ^ 4 * I(| Z |> 1)之间))和E(Z ^ 4 * I(| Z |> 1))+1。(ii)在Z ^ 2的密度连续且在(0,1)上减小的子类中,“ + 1”可用“ +.5”代替。(iii)对于任何具有峰度->无穷大的分布序列,对于任何实数b,E(Z ^ 4 * I(| Z |> b))/峰度-> 1。一切都在这里:ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.