预期值与非正态分布中的均值,中位数等有何关系?


9

连续随机变量的期望值在非正态分布(例如偏正态)中如何与算术平均值,中位数等相关?我对任何常见/有趣的分布都感兴趣(例如,对数正态分布,简单的双向/多峰分布,其他任何奇怪而奇妙的分布)。

我主要在寻找定性答案,但是也欢迎任何定量或公式化答案。我特别希望看到任何使其更清晰的视觉表示。


你能说清楚一点吗?算术平均值和中位数是我们应用于数据的函数,而不是特定分布所固有的任何函数……例如,数据不必为正态值即可计算样本平均值。
来宾

好的,所以从技术上讲,问题应该是“期望值如何与从特定概率分布中随机抽取的数据的均值,中位数等相关?” 我正在寻找简单,直观的理解,就像您可以凭直觉说的那样,当分布更偏斜时,中位数和均值会进一步分开,并且中位数可能会更好地表明数据的位置。
naught101'2012-2-28

h 谢谢马可。我显然一直在读错东西。最好写下来作为答案,我会选择他的最佳答案。
naught101 2012年

Answers:


8

(部分从我现在上面删除的评论中转换而来)

期望值和算术平均值完全相同。中位数以非平凡的方式与均值相关,但是您可以对它们之间的关系说几件事:

  • 当分布对称时,均值和中位数相同

  • 当分布出现负偏斜时,中位数通常大于平均值

  • 当分布正偏时,中位数通常小于均值


有趣。有什么例子说明均值大于中值的负偏分布的异常行为?
naught101 2012年

@ naught101:这是错字吗?负偏斜分布是这样一种分布,其中,中心偏左的结果比中心偏右的结​​果更频繁发生,因此低频结果的“尾巴”向右偏出。在这种情况下,左侧的驼峰将始终拉动(算术)平均值的中心左方,而右侧的尾巴将使中位数大于平均值。
阿萨德·易卜拉欣2014年

@AssadEbrahim:不,这是对Macro的评论的引用,“中位数通常大于平均值” -我在问反例。
naught101

@ naught101:在单峰分布情况下的反例是他的下一行:当驼峰位于右侧时,则尾巴位于左侧,使中位数低于均值。尾巴越长,中位数和均值之间的差距越大。
阿萨德·易卜拉欣

1
在实际情况下,将使用中位数而不是均值的情况是什么?例如,在生存分析中,生命遵循指数分布,如果我必须将生存/死亡作为二进制来预测,那么我应该使用中位数(所以事物的一半寿命更长,寿命减少一半)还是平均值(“预期”寿命)结果?
drevicko 2015年

5

数正态分布随机变量的谐波,几何和算术平均值之间存在良好的关系X大号ñμσ2。让

  • H中号X=Ëμ-1个2σ2 (谐波平均值),
  • G中号X=Ëμ (几何平均数),
  • 一个中号X=Ëμ+1个2σ2 (算术平均值)。

不难看出,谐波与算术平均值的乘积得出了几何平均值的平方,即

H中号X一个中号X=G中号2X

由于所有的值都是正的,我们可以采取squre根发现的几何平均值X 是的谐波平均值的几何平均值 X 和的算术平均值 X,即

G中号X=H中号X一个中号X

此外,众所周知的HM-GM-AM不等式

H中号XG中号X一个中号X

可以表示为

H中号XGV一个[RX=G中号X=一个中号XGV一个[RX

哪里 GV一个[RX=Ëσ2 是几何差异。


1

为了完整性,也存在一些均值定义不明确的分布。一个典型的例子是柯西分布(这个答案很好地解释了为什么)。另一个重要示例是指数小于2 的Pareto分布


1
几个iff。幂定律不是分布,但是帕累托分布是幂定律。这涉及对数凸对数幂函数在X=0。对于一个功法,你的意思是小于2,不大于2
卡尔

@卡尔要点-我相应地编辑了答案。Many thx(:
drevicko

0

虽然在数学上均值和期望值定义相同是正确的,但是对于偏斜的分布,此命名约定会产生误导。

想象一下,您正在向一位朋友询问她所在城市的房价,因为您真的很喜欢那里,然后真正考虑搬到该城市。

如果房屋奖励的分配是单峰且对称的,那么您的朋友可以告诉您房屋的平均价格,实际上您可以期望在该平均值附近找到市场上的大多数房屋。

但是,如果住房价格的分布是单峰的并且是偏斜的,例如向右偏斜,而大多数房屋在较低的价格范围向左,而只有一些过高的房屋在右侧,则均值将“偏斜”到较高的价格。正确的。

对于这种单峰的,偏斜的房价分布,您可以期望在市场中位数附近找到大多数房屋。


1
当您说偏斜的单峰分布时,您的意思不清楚,房价分布的价格在中位数附近。可以说的是,一半的值等于或低于中位数,一半的值等于或高于中位数。它并不表示这些值与平均值有多接近。
Michael R. Chernick

我认为您的最后一句话应该以“中位数”结尾?如果是这样,我认为很明显,中位数必须是最接近从上述人群中抽取的随机样本的平均值(可能无法达到,例如,不是房价)的(可达到)值。平均而言,这是最接近该平均样本的中位数。如果不是这样,我没有声称这些值与平均值有多接近。我声称它们与中位数的距离。
索尔哈托
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.