我们什么时候使用密义数字和中间数字而不是分位数和中间数字?


14

我无法在Wikipedia或Wolfram Mathworld上找到密义或中间的定义,但是在Bílková,D.和Mala,I.(2012),“ 对收入分配建模时应用L-矩方法的应用 ”中给出了以下解释在捷克共和国 ”,奥地利统计杂志第41卷第 2期,第125-132页。

中间值为(样本)的密不可分值,就像样本中位数等于样本分位数)的值一样。样品密实度以及样品分位数均基于订购的样品。首先,对有序样本中观测值的累积总和进行评估。然后,对于给定的百分比,,将零位定义为分析变量的值,该变量将有序样本中的所有观测值分为两部分:较小或相等的观测值之和为占总观测值的,大于总观测值的表示该总和的剩余。50 p 0 < p < 100 p p 100 - p 5050p0<p<100p%p%(100p)%

什么时候将这些用作位置度量而不是更常规的中位数或其他分位数有意义?该论文给出了一种可能的情况,即家庭收入:

从这个定义可以得出,中间收入可以用作收入水平的合理特征,因为收入较低或等于中间收入的家庭将获得样本中总收入的一半,收入较高的家庭比接受另一半的内侧

在这种情况下,发现家庭收入中位数为117,497 捷克克朗(即,有一半家庭的收入高于该水平,另一半家庭的收入高于上述水平),而家庭中位收入为133,930捷克克朗(收入高于该数字的家庭则获得了一半的收入)总收入)。请注意,这种比较并不一定反映家庭收入的偏度,甚至不一定是其不均匀性:即使家庭收入是均匀分配的,中位数仍将高于中位数。据我了解的定义,如果所有家庭都获得相同的收入,则中位数将仅等于中位数。

那么,在这种情况下,是否有任何特定的原因更喜欢内侧,或者至少将其用作辅助措施?中位数和中位数之间的比较究竟告诉我们什么?出于我刚刚指出的原因,中间似乎并不能直接与其他集中趋势指标相提并论。在其他情况下,中间/义齿是否被广泛使用或被视为特别有用?在样本研究论文中使用它们的实际例子将是非常受欢迎的,而在更广泛的背景下直观证明它们可能有用的想法会更好。

它必须要求总计和小计是有意义的-似乎与金钱有关的东西,以及“饼”的分配方式-但即使加法动作也仅对某些数量有意义。对于密集而不是广泛的属性(例如密度或温度),任何形式的求和在物理上都是没有意义的。在我看来,广泛的属性是必要的,但不足以使密宗有所帮助,因为我可以想象一位运输分析师对所运送的货物的重量有限制,因此所有货物(按重量计)的50%它承载的重量等于或大于此重量,但我无法想象生态学家会对new的长度感兴趣,以至于所有new的总长度的50%是由该长度或更长的new贡献的。


3
@NickCox据我所知,中位数给出了一个临界值,粗略地说(我完全忽略了联系的问题),一半家庭的收益大于临界值,一半家庭的收益小于临界值。中间给出了不同的截止值,这样,收入超过截止值的家庭的总收入构成了所有收入的50%,而收入低于截止值的家庭的总收入则构成了所有收入的50%。
银鱼

2
帽子提示:@ttnphns对我的上一个问题发表评论后,我对此感到好奇。平均值(算术,几何,谐波,幂,指数,组合等)是“解析平均值”。中位数,分位数,密语是“位置平均值”。
银鱼

4
谢谢; 我误读了此内容,并感谢纠正。我会从“观察值之和”改写为“值之和”,因为“观察值之和”对我来说太接近“观察值的数量”。也许我正在找借口...。应该与洛伦兹曲线有关。仅当相关变量在概念上是累加或广泛的时,该措施才有用。David Cox爵士经常强调变量是否广泛的重要性。因此,考虑总收入,总降雨量,而不考虑总原木收入或总温度实际上是有意义的。
尼克·考克斯

2
@NickCox我认为扩展性是一个很好的观点(我认为您建议的重新措词也将有所改善),尽管在我看来,广泛的属性是必要的,但不足以使密宗受益。我们可能感兴趣的似乎是合理的,例如,所运送的货物的重量是多少,以至于所有货物(按重量计)的50%承载在该重量或以上的负载中;但我无法想象对new的长度感兴趣,以至于所有new的总长度的50%是由该长度或更长的new贡献的。
银鱼

1
我在实践中同意,但我认为该原则不受影响。对“但是那将不会有趣或有用”的答案不一定总是某种数学或统计原理的展示。还有“不要这样做!”的范围。
尼克·考克斯

Answers:


3

这确实是评论,但评论太长。它试图阐明“密实”的定义(在p=0.5情况下,类似于中位数)。令X为具有密度函数f(x)的(为简单起见)绝对连续随机变量。我们假设期望μ=EX不存在,也就是积分μ=xf(x)dx收敛。定义,类似与累积分布函数,一个“累积期望函数”(我从来没有见过这样一个概念,它有一个正式的名字吗?)由

G(t)=txf(x)dx
那么“tantile”是溶液t等式G(t)=μ/2

这种解释正确吗?这是原意吗?

回到最初的问题,在收入分配的背景下,最重要的是收入的价值,即总收入的一半用于收入高于该收入的人,总收入的一半用于收入低于该收入的人。

EDIT

G(t)

G(t)t

用于此想法的另一个术语是“部分期望”。参见例如/math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r 并使用google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
感谢您的添加-我将不得不阅读一下它的外观!
银鱼
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.