我认为中位数表示平均值。
是这样吗
我认为中位数表示平均值。
是这样吗
Answers:
这是一个不平凡的问题(肯定不像问这个问题的人想的那么简单)。
困难最终是由以下事实造成的:我们实际上并不了解“偏斜度”的含义-很多时候,这种偏斜度是显而易见的,但有时并非如此。鉴于很难在非平凡的情况下确定“位置”和“价差”的含义(例如,在讨论位置时,平均值并不总是我们所指的意思),因此,更微妙的修饰也就不足为奇了偏度这样的概念至少很滑。因此,这导致我们尝试对我们的意思进行各种代数定义,但它们并不总是彼此一致。
1)如果您通过第二个Pearson偏度系数来测量偏度,则平均值()将小于中值(,即,在这种情况下,它是向后的)。
(人口)第二个Pearson偏度为当时为负(“左偏度”)。
这些统计信息的样本版本工作类似。
在这种情况下,均值和中位数之间必不可少的关系的原因是因为这就是偏度度量的定义方式。
这是左偏斜的密度(通过第二个Pearson度量和下面的(2)中更常见的度量):
中位数在下边缘以绿色标记,平均值在红色中标记。
因此,我希望他们希望您给出的答案是平均值小于中位数。通常情况下,我们倾向于给它们起名字的分布。
(但请继续阅读,并了解为什么这实际上不是一般性的说法。)
2)如果您通过更通常的标准化第三矩进行测量,则该情况经常(但并非总是如此)表示该平均值小于中位数。
就是说,有可能构造相反的情况正确的示例,或者一个偏度量度为零而另一个偏度量度为非零的示例。
也就是说,均值,中位数和矩偏度的位置之间没有必要的关系。
例如,考虑以下示例(同一示例可以构造为离散概率分布):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
但是,(Fisher,第三矩)偏度系数为负(即,根据其光,我们有左偏度数据),因为与均值的方差之和为负。
因此,在这种情况下,向左倾斜,但表示>中位数。
(另一方面,如果将上述示例中的2.7更改为3,则有一个示例,其中偏斜度为零,但均值超出了中位数。如果设为3.3,则偏斜度为正,且均值超出了中位数-即最终处于“预期”方向。)
如果使用第一个Pearson偏度而不是上述定义中的任何一个,则与这种情况存在类似的问题-偏度的方向通常不会限制均值和中位数之间的关系。
编辑:回答评论中的问题-均值和中位数相等,但矩偏度为负的示例。考虑以下数据(像以前一样,它也可以作为离散总体的一个示例;考虑将数字写在模具的表面上)。
1 5 6 6 8 10
均值和中位数均为6,但与均值的方差之和为负,因此三次矩偏度为负。
不会。左偏数据的左侧尾巴较长(低端),因此平均值通常小于中位数。(但是请参阅@Glen_b的答案以获取例外信息)。随便地,我认为“看起来”左偏的数据的平均值小于中位数。
右偏数据更常见;例如收入。那里的平均值大于中位数。
R代码
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001