在左偏数据中,均值和中位数之间是什么关系?


12

我认为中位数表示平均值。

是这样吗


2
那是哪个公开的MOOC课程?课程材料建议答案应该是什么?
Glen_b-恢复莫妮卡2014年


1
谢谢,至少这是一个上下文,尽管剩下的只是每周的阅读量,对这个问题的关注并不多。我确实想知道该课程对这个话题要说些什么。
Glen_b-恢复莫妮卡2014年

Answers:


16

这是一个不平凡的问题(肯定不像问这个问题的人想的那么简单)。

困难最终是由以下事实造成的:我们实际上并不了解“偏斜度”的含义-很多时候,这种偏斜度是显而易见的,但有时并非如此。鉴于很难在非平凡的情况下确定“位置”和“价差”的含义(例如,在讨论位置时,平均值并不总是我们所指的意思),因此,更微妙的修饰也就不足为奇了偏度这样的概念至少很滑。因此,这导致我们尝试对我们的意思进行各种代数定义,但它们并不总是彼此一致。

1)如果您通过第二个Pearson偏度系数来测量偏,则平均值()将小于中值(,即,在这种情况下,它是向后的)。μμ

(人口)第二个Pearson偏度为当时为负(“左偏度”)。

3(μμ)σ,
μ<μ

这些统计信息的样本版本工作类似。

在这种情况下,均值和中位数之间必不可少的关系的原因是因为这就是偏度度量的定义方式。

这是左偏斜的密度(通过第二个Pearson度量和下面的(2)中更常见的度量):

在此处输入图片说明

中位数在下边缘以绿色标记,平均值在红色中标记。

因此,我希望他们希望您给出的答案是平均值小于中位数。通常情况下,我们倾向于给它们起名字的分布。

(但请继续阅读,并了解为什么这实际上不是一般性的说法。)


2)如果您通过更通常的标准化第三矩进行测量,则该情况经常(但并非总是如此)表示该平均值小于中位数。

就是说,有可能构造相反的情况正确的示例,或者一个偏度量度为零而另一个偏度量度为非零的示例。

也就是说,均值,中位数和矩偏度的位置之间没有必要的关系。

例如,考虑以下示例(同一示例可以构造为离散概率分布):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

但是,(Fisher,第三矩)偏度系数为负(即,根据其光,我们有左偏度数据),因为与均值的方差之和为负。

因此,在这种情况下,向左倾斜,但表示>中位数。

(另一方面,如果将上述示例中的2.7更改为3,则有一个示例,其中偏斜度为零,但均值超出了中位数。如果设为3.3,则偏斜度为正,且均值超出了中位数-即最终处于“预期”方向。)

如果使用第一个Pearson偏度而不是上述定义中的任何一个,则与这种情况存在类似的问题-偏度的方向通常不会限制均值和中位数之间的关系。


编辑:回答评论中的问题-均值和中位数相等,但矩偏度为负的示例。考虑以下数据(像以前一样,它也可以作为离散总体的一个示例;考虑将数字写在模具的表面上)。

 1  5  6  6  8 10

均值和中位数均为6,但与均值的方差之和为负,因此三次矩偏度为负。


1
@Peter对不起,我的回复很慢,我正忙于构建这样的示例,但没有看到您的问题。
Glen_b-恢复莫妮卡2014年

2
我看过很多教科书定义,但都没有提及。凉。
彼得·弗洛姆

6
@Peter不幸的是,许多基本教科书只是重复了其他教科书中的错误信息,而自己并未进行任何真正的调查,因此传播了基本的误解。如您所见,反例相对容易构建(我只是根据需要手工制作)。肯德尔(Kendall)和斯图尔特(Stuart)(高级统计理论,第一卷 -标题不要让您失望,它易于阅读),至少在第三版和第四版中都有很好的信息。最近的版本是Stuart和Ord。实际上,我已经多次在简历上发布过有关此问题的信息。
Glen_b-恢复莫妮卡2014年

4
二项式和表明均值中位数与不对称性完全一致。关于此示例的一点是,没有人可以令人信服地将其视为晦涩或病态。(5k)0.8k0.25k(5k)0.2k0.85k=
Nick Cox 2014年

1
@尼克是的,具有整数均值的二项式就是很好的例子。
Glen_b-恢复莫妮卡2014年

5

不会。左偏数据的左侧尾巴较长(低端),因此平均值通常小于中位数。(但是请参阅@Glen_b的答案以获取例外信息)。随便地,我认为“看起来”左偏的数据的平均值小于中位数。

右偏数据更常见;例如收入。那里的平均值大于中位数。

R代码

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001

平均值可以等于中位数吗?
Kunjan Kshetri 2014年

我在答案中添加了一个示例,其中第三矩偏斜为负,但均值=中位数。
Glen_b-恢复莫妮卡2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.