Questions tagged «trimmed-mean»

4
Winsorizing与Triming数据的相对优点是什么?
Winsorizing数据意味着用两端的某个百分位值替换数据集的极值,而Trimming或截断涉及删除这些极值。 我总是将讨论的两种方法视为在计算诸如均值或标准差之类的统计数据时减轻异常值影响的可行选择,但我还没有看到为什么一个人可能会选择另一个。 使用Winsorizing或Trimming有什么相对优点或缺点?在某些情况下,最好使用一种方法吗?在实践中是否经常使用一种或它们基本上可以互换?

3
如何解释修整百分比与修整平均值的关系图?
对于作业问题的一部分,我被要求通过删除最小和最大的观测值来计算数据集的修整平均值,并解释结果。修整后的平均值低于未修整的平均值。 我的解释是,这是因为基础分布正偏,所以左尾比右尾更密。由于这种偏斜,删除高基准数据会比平均低基准数据向下拖累平均值下降更多,因为从非正式的角度来说,还有更多的低数据在“等待取代”。(这合理吗?) 然后,我开始怀疑修整百分比如何对其产生影响,因此我针对各种计算了修整后的平均值。我得到了一个有趣的抛物线形状: x¯tr(k)x¯tr⁡(k)\bar x_{\operatorname{tr}(k)}k=1/n,2/n,…,(n2−1)/nk=1/n,2/n,…,(n2−1)/nk = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n 我不太确定该如何解释。从直觉上看,似乎曲线图的斜率应该(与中位数的数据点内的分布部分的负偏度成正比)。(这个假设确实可以验证我的数据,但是我只有,所以我不太有把握。)kkkn=11n=11n = 11 这种类型的图是否有名称,还是常用的?我们可以从该图中收集哪些信息?有标准解释吗? 作为参考,数据为:4、5、5、6、11、17、18、23、33、35、80。

2
均值vs中位数
我有一个数据集,其中包含对紧急服务的所有呼叫以及急救部门的响应时间。他们承认响应时间存在一些错误,因为在某些情况下他们没有开始记录(因此值为0)或没有停止时钟(因此值可能非常高)。 我想找出中心趋势,我想知道使用中位数或修整后的平均值来消除异常值是否更好?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.