我对基本统计中通常使用的四分位数的定义感兴趣。我有一本Stat 101类型的书,它只是给出了一个直观的定义。“大约四分之一的数据落在第一个四分位数上或以下...”但是,它给出了一个示例,其中该示例计算了该组数据的Q1,Q2和Q3
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
由于有15条数据,因此选择15作为中位数Q2。然后,它将剩余的数据分为两半,分别为5至14和16至37。它们每个包含7个数据,它们分别将这些集合10和18的中位数分别作为Q1和Q3。这就是我自己计算的方式。
我看了维基百科的文章,它提供了两种方法。一个人同意上述观点,有人说您还可以在两个集合中都包含15个中位数(但是,如果数据点为偶数,则如果中位数是两个中间数的平均值,则不包括在内)。这对我来说很有意义。
但是,然后我检查了Excel以查看Excel如何计算它。我正在使用Excel 2010,它具有3种不同的功能。四分位数在2007年及以前的版本中可用。似乎他们希望您在2010年停止使用此功能,但仍然可用。Quartile.Inc是新的,但据我所知,它与Quartile完全一致。并且,还有Quartile.Exc。我认为最后两个都是2010年的新功能。这次,我只是尝试使用整数1、2、3,...,10。我期望Excel给出5.5的中位数,3的Q1和8的Q3。因为Wikipedia上的两种方法都会给出这些答案,因为中位数是中间两个数字的平均值。Excel给
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
这些都不符合我之前所说的。
Excel帮助文件中的描述为:
Quartile.Inc-基于0..1(含0)的百分位值返回数据集的四分位数。
Quartile.Exc-基于0..1(不包括)的百分位值返回数据集的四分位数。
谁能帮助我了解Excel正在使用的此定义?