平均值=中位数是否意味着单峰分布是对称的?


19

对于单峰分布,如果均值=中值,那么说分布是对称的就足够了吗?

维基百科在平均值和中位数之间的关系中说:

“如果分布是对称的,则均值等于中值,并且分布将具有零偏度。此外,如果分布是单峰的,则均值=中值=模式。这就是抛硬币或系列1,2,3,4,...,但是,请注意,相反的情况通常并不正确,即零偏度并不意味着均值等于中位数。”

但是,(对我而言)收集我需要的信息不是很简单。请帮忙。

Answers:


27

这是一个不对称的小反例:-3,-2、0、0、1、4是单峰的,其众数=中位数=均值= 0。

编辑:一个更小的例子是-2,-1、0、0、3。

如果您想想象一个随机变量而不是一个样本,则将其支撑设为{-2,-1,0,3},所有概率质量函数均为0.2,但0为0.4。


6
我相信-2,-1、0、0、3是“最小的”离散反例:我们需要两个相等的值来创建模式,添加第三个不同的值将防止均值等于中值,而第四个值只能恢复通过恢复对称性等于平均值​​的中位数。我还怀疑这些数字可能是“最小”(接近0)整数,因为3是我们可以写为两个不同整数之和的最小整数。区分至关重要,因为尝试-1,-1、0、0、2不再是单峰的!自然,我们可以缩放和转换以获得具有此属性的新数据集。
银鱼

19

这开始只是一个评论,但是时间太长了。我决定让它更多地成为答案。

一种一种

我想处理一些其他问题,并在这里指出一些与之相关的广泛答案。

  1. 您引用的Wikipedia页面上的声明也不是严格正确的。例如,考虑柯西分布,该柯西分布的中位数肯定是对称的,但没有均值。该陈述需要一个限定词,例如“只要存在均值和偏度”。即使我们将其简化为第一句前半部分的较弱陈述,也仍然需要“只要存在均值”。

  2. 您的问题部分使对称性与零偏度相抵触(我假设您打算进行三次矩偏度,但是对于其他偏度测度也可以进行类似的讨论)。偏度为0并不表示对称。尽管第二个引用中的解释可能需要一些调整,但引用的后半部分和Alexis在Wikipedia中引用的部分都提到了这一点。

该答案表明,第三矩偏度与均值和中位数之间的关系的方向较弱(第三矩偏度和第二皮尔逊偏度不必对应)。

该答案的第1项给出了一个独立的反例,类似于但不同于Silverfish给出的反例。

编辑:我终于挖出了我实际上早先正在寻找的单峰示例。

这个答案中,我提到以下家庭:

1个24经验值-X1个/4[1个-αX1个/4]

α=0α=1个2

在此处输入图片说明

(灰色线显示蓝色密度绕x轴翻转,使不对称变得平淡)

Whuber 在这里给出了另一个示例,该示例具有零偏度,该偏度是连续的,单峰的和不对称的。我复制了他的图:

连续的例子

其中显示了示例,并且均值翻转了平均值(以清楚地显示不对称性),但您应该阅读原始文档,其中包含许多有用的信息。

[Whuber的答案同一时刻给出了另一个非对称连续分布族。进行相同的“选择两个,翻转一个并进行50-50混合”的技巧具有相同的不对称结果,所有奇数矩均为零,但我认为这里没有给出单峰结果(尽管也许有一些示例)。 ]

这里的答案讨论了均值,中位数和众数之间的关系。

这个答案讨论了对称性的假设检验。


非常感谢。您对stats.stackexchange.com/questions/56511/…的引用实际上是提出上述问题的原因。
卡卡2014年

8

没有。

此外,如果分布是单峰的,则均值=中位数=众数。

与“如果小动物是鸡,那么它的起源是鸡蛋”的含义相同,并不意味着“如果小动物是鸡,那么小动物就是鸡”。

来自同一Wikipedia文章:

如果一条尾巴很长而另一条尾巴很胖,则偏斜不能遵循简单的规则。例如,零值表示均值两侧的尾部平衡,这对于对称分布和不对称分布均匀的非对称分布(例如一条尾巴长而细)以及其他人矮而胖。


1
请注意,在单峰对称情况下,您可以具有(易于构造的示例)平均值= meadian =最小密度为(0)的点!
kjetil b halvorsen

2

有趣且易于理解的示例来自二项式分布。

×=

            1        2
    +-------------------+
  1 |       0   .32768  |
  2 |       1    .4096  |
  3 |       2    .2048  |
  4 |       3    .0512  |
  5 |       4    .0064  |
  6 |       5   .00032  |
    +-------------------+

此显示的Stata代码过去很mata : (0..5)' , binomialp(5, (0..5), 0.2)'可能在任何值得一提的统计软件中都一样简单。

从心理学而不是逻辑的角度来看,不能令人信服地将这个示例视为病理性的(因为在其他问题中,人们可能会不考虑某些时刻甚至不存在的分布),或者出于该目的而做出的一个奇怪或琐碎的示例(如例如@Silverfish或0、0、1、1、1、1、3)描述的发明数据。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.