中位数在[Mode-Mean]之外的反例


11

文章是我上面的联赛,但它谈论,我很感兴趣,之间的平均,模式和中位数的关系的话题。它说 :

普遍认为,单峰分布的中值“通常”在均值和众数之间。但是,并非总是如此...

我的问题:有人可以提供中位数在[众数,均值]区间之外的连续单峰(理想情况下简单)分布的示例吗?例如的分布mode < mean < median

===编辑=======

Glen_b和Francis已经有了很好的答案,但是我意识到我真正感兴趣的是一个示例,其中众数<均值<中位数或中位数<均值<模式(这两个中位数都在[众数,均值]之外,而中位数是与模式均值“在同一侧”(即高于或低于模式)。我可以接受这里的答案是一个新问题,或者有人可以在这里直接提出解决方案?


将答案扩展到更严格的情况是没有问题的。
Glen_b-恢复莫妮卡

2
在此处查看图6:ww2.amstat.org/publications/jse/v13n2/vonhippel.html,给出了(连续单峰)Weibull示例,其中中位数不在众数和均值之间。
马修塔楼

Answers:


14

当然,不难发现示例-甚至是连续单峰示例-中位数不在均值和众数之间。

  1. 考虑形式为的三角分布的 iidf Tt = 2 1 t 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    现在让是和的60-40混合物。T 14 T 2XT14T2

    的密度如下所示:X

    两个三角形密度的混合,中位数在模均值区间之外

    平均值小于0,众数为0,但中位数大于0。对此进行较小的修改将产生一个示例,其中即使是密度(而不只是cdf)也是连续的,但是位置度量之间的关系是相同(编辑:请参见下面的3.)。

  2. 概括地说,让我们将总概率的比例()放入右侧三角形,并将比例放入左侧三角形(代替0.6和0.4我们之前有过)。此外,将比例因子设为左半部分而不是(带有):0 < p < 1 1 - p - β - 4 β > 0p0<p<1(1p)β4β>0

    两个三角形密度的混合物的广义形式的密度

    现在假设,中位数将始终在直角三角形所覆盖的区间内,因此中位数将超过众数(始终保持为)。特别是,当,中位数将为。 0p>1p>120 11/p>1211/2p

    平均值将为。(pβ(1p))/3

    如果则平均值将低于模式;如果则平均值将高于模式。β < p /1 p β>p/(1p)β<p/(1p)

    另一方面,我们希望将平均值保持在中位数以下。(pβ(1p))/3<11/2p

    考虑 ; 这会使中位数高于模式。p=0.7

    然后将满足因此均值在众数之上。β < p /1 - p β=2β<p/(1p)

    中位数实际上是而平均值是。因此,对于和,我们有众数<平均值<中位数。 0.7 - 2 0.3 11/1.40.1548p=0.7β=20.72(0.3)30.0333p=0.7β=2

    (注:为了与我的符号保持一致,两个图的x轴上的变量都应为而不是但我不会回过头来对其进行修复。)Ťxt

  3. 这是密度本身是连续的示例。它基于上面1.和2.中的方法,但是用“斜率”替换为陡峭的斜率(然后整个密度翻转为0,因为我想要一个看起来右偏的示例)。

    连续的分段线性密度,中值<均值<众数

    [使用“三角形密度的混合物”的方法,可以为一体的三角形形式的3个独立的经缩放的变元的混合物在部分1中所描述我们现在有15%产生,60%和25%。]3 T 2 5 T 3T13T25T3

    正如我们在上图中所看到的,均值应要求位于中间。


  1. 请注意,m_t_在注释中提到了Weibull(对于形状参数的较小范围,其中位数在区间之外)。这可能是令人满意的,因为它是众所周知的具有简单功能形式的单峰连续(平滑)分布。k[mode,mean]k

    特别是,对于Weibull形状参数的较小值,分布是右偏,并且在模式和均值之间存在中值的常见情况,而对于Weibull形状参数的较大值,分布是左偏。 ,我们再次遇到“中间居中”的情况(但现在模式在右边而不是平均值)。在这两种情况之间是一个小区域,中位数在均值模式区间之外,中间是均值和众数交叉:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    在上面标记为(1)和(2)的间隔中为shape参数选择方便的值-位置统计之间的差距大约相等的间隔-我们得到:

    中位数在众数均值区间之外的威布尔密度

    尽管这些满足要求,但不幸的是,三个位置参数之间的距离非常近,以至于我们无法从视觉上区分它们(它们全部落在同一像素中),这有点令人失望-我前面示例中的情况更多分开。(尽管如此,它的确建议了要与其他分布一起检查的情况,其中某些分布可能会带来视觉上更加明显的结果。)


可行,谢谢。出于好奇,模式<均值<中值是什么类似的“三角分布”?(此处的中位数<模式<均值)
Janthelme,2013年

实际上,在我最初的示例中,mean <mode <median;你那里不平等。现在我已经添加了一个类似的例子,其中平均高于模式,但中位数(以下的确,你可以简单地取代了原来的有发言权在并保持化合物的混合比例的右半部分和的左部分)。1.25 T 2 0.6 0.44T21.25T20.60.4
Glen_b-恢复莫妮卡

6

以下示例摘自Jordan Stoyanov的《概率反例》

给定正常数和,请考虑密度为的随机变量的平均,中位数和模式的可以发现注意仅当才是密度因此,如果让则。接近cλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf x c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c ^1λ2ç>111.0001μ>C ^中号=Çμ中号
c22+cλ=1.
c1λ2c>11(例如),我们可以发现和,因此中位数不在和之间。1.0001μ>cM=cmμM

0

取速率参数为a且密度为0 <= x <无穷大的exp(-ax)的指数分布。模式为零。当然,平均值和中位数大于0。cdf为1-exp(-ax)。因此对于x的中位数求解exp(-ax)= 0.5。然后-ax = ln(0.5)或x = -ln(0.5)/ a。对于平均值,将ax exp(-ax)从0积分到无穷大。取a = 1,我们有一个中位数= -ln(0.5)= ln(2),平均值= 1。

因此,模式<中位数<平均值。


1
抱歉,但是我们不是要寻找众数<均值<中位数(或更普遍地说,中位数在[众数,平均值]之外)的分布吗?
Janthelme '16

3
抱歉,我确实在原始问题中添加了疑问,但我最初要问的是示例中位数在[众数,均值]之外的示例,而我认为中位数在[众数,均值]范围内。
Janthelme '16

3
迈克尔(Michael),这个问题并不要求中位数介于众数和均值之间。您在此注释的正上方错误地引用了原始注释;该问题并未在您声明的地方说“ mode <median <mean”(并且从未在编辑历史记录中的任何时候这样做)。结果,您的答案提供了一个不需要的案例;确实,这是该问题从中寻求例外的通常情况(在另两个中间)。几乎所有众所周知的偏斜单峰分布的中间值都在中间-诀窍是找到不这样做的中值。
Glen_b-恢复莫妮卡

1
通过单击问题底部当前显示为“ 18小时前已编辑”的红色链接(在我键入这些评论时,它变为19),可以使用编辑历史记录。单击此处可以查看编辑的历史记录。该问题是22个小时前发布的(当我现在输入时),当您单击进入编辑历史记录时,可以在底部标有“ 1”的地方看到原始问题。您的答案大约在2小时后(20小时前)出现,那时问题仍然在说。在您发布帖子后大约1-2小时,OP对其问题进行了一次编辑,可以看到...
Glen_b -Reinstate Monica

1
ctd ...在编辑历史记录的顶部。.每次编辑后都有一个两分钟的窗口,使所做的更改算作该编辑的一部分(例如,在22个小时之前和18-19个小时之前,分钟的时间(每次输入错字的时间可能已得到修正)),但在您发布内容的大约20个小时前,该问题在大约2个小时内未发生变化,而在您进行重大修改后,问题在您发布后的一个多小时内没有发生变化。显示在编辑历史记录中)。这些简短的两分钟后编辑窗口之外的任何编辑都将在编辑历史记录中。
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.