连续随机变量的期望值在非正态分布(例如偏正态)中如何与算术平均值,中位数等相关?我对任何常见/有趣的分布都感兴趣(例如,对数正态分布,简单的双向/多峰分布,其他任何奇怪而奇妙的分布)。
我主要在寻找定性答案,但是也欢迎任何定量或公式化答案。我特别希望看到任何使其更清晰的视觉表示。
连续随机变量的期望值在非正态分布(例如偏正态)中如何与算术平均值,中位数等相关?我对任何常见/有趣的分布都感兴趣(例如,对数正态分布,简单的双向/多峰分布,其他任何奇怪而奇妙的分布)。
我主要在寻找定性答案,但是也欢迎任何定量或公式化答案。我特别希望看到任何使其更清晰的视觉表示。
Answers:
(部分从我现在上面删除的评论中转换而来)
期望值和算术平均值完全相同。中位数以非平凡的方式与均值相关,但是您可以对它们之间的关系说几件事:
当分布对称时,均值和中位数相同
当分布出现负偏斜时,中位数通常大于平均值
当分布正偏时,中位数通常小于均值
虽然在数学上均值和期望值定义相同是正确的,但是对于偏斜的分布,此命名约定会产生误导。
想象一下,您正在向一位朋友询问她所在城市的房价,因为您真的很喜欢那里,然后真正考虑搬到该城市。
如果房屋奖励的分配是单峰且对称的,那么您的朋友可以告诉您房屋的平均价格,实际上您可以期望在该平均值附近找到市场上的大多数房屋。
但是,如果住房价格的分布是单峰的并且是偏斜的,例如向右偏斜,而大多数房屋在较低的价格范围向左,而只有一些过高的房屋在右侧,则均值将“偏斜”到较高的价格。正确的。
对于这种单峰的,偏斜的房价分布,您可以期望在市场中位数附近找到大多数房屋。