为什么中位数的95%CI应该是?


11

在各种来源中(例如参见此处),给出了以下中位数的置信区间的公式(尤其是在箱须图上画凹口的目的):

95% CImedian=Median±1.57×IQRN

魔法常数使我发疯,我无法弄清楚它是如何获得的。各种近似值(例如,假设我们的分布是高斯分布且大)都没有任何线索-我得到的常数值不同。1.57N


Answers:


15

这很容易。如果我们查看引入有缺口盒须图的原始论文(Robert McGill,John W. Tukey和Wayne A. Larsen。Box Plots的变化,《美国统计学家》,第32卷,第1期,(2月, (1978),第12-16页;幸运的是,它在JSTOR上,我们找到了第7节,其中该公式的解释如下:

如果一个人希望有一个缺口,表示每个中位数有95%的置信区间,则应使用C = 1.96。[这里的C是与我们的常数不同的常数,但是确切的关系并不重要,这将在稍后澄清-IS]但是,由于需要一种“间隙规”的形式来表示在95%的水平上存在显着差异。 ,此操作尚未完成。可以证明,只有当两组的标准差相差很大时,C = 1.96才是合适的。如果它们几乎相等,则C = 1.386将是适当的值,而1.96将导致测试过于严格(远远超过99%)。 根据经验,最好选择介于这些极限之间的值C = 1.7。 因此,使用的缺口计算为M±1.7(1.25R/1.35N)

重点是我的。请注意,这是您的幻数。1.7×1.25/1.35=1.57

因此,简短的答案是:它不是中位数CI的通用公式,而是可视化的特定工具,并且根据经验选择了常数以实现特定的目标。

没有魔术。

抱歉。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.