计算序数变量的平均值


20

我在很多地方都读过,计算序数变量的平均值是不合适的。我正在尝试了解为什么可能不合适。我认为这是因为一般而言,序数变量不是正态分布的,因此计算均值将给出不正确的表示形式。有人可以给出更详细的理由来说明为什么计算序数变量的平均值可能不合适吗?


8
要计算平均值,您首先需要求和。为了使总和有意义,您需要4 + 2与3 + 3相同;同样,您需要4-3 = 3-2 = 2-1。对于序数数据-即使将其类别标记为“ 1”,“ 2”,“ 3”,“ 4”,也不一定(明确)。
Glen_b-恢复莫妮卡

为什么中位数比算术平均值更合适?

Answers:


24

一个简短的答案是,这是有争议的。与您提到的建议相反,许多领域的人的确会使用序数表,并且常常高兴地做到了自己想要的事。一个示例是平均成绩或许多教育系统中的同等水平。

但是,序数数据未进行正态分布不是有效的原因,因为均值是

  • 广泛用于非正态分布

  • 对于许多非正态分布,除了在某些病理情况下,数学上定义得很好。

如果数据绝对不是正态分布的,那么在实践中使用均值可能不是一个好主意,但这是不同的。

不将平均数与有序数据一起使用的更强力原因是,其均值取决于编码约定。通常仅出于简化或方便的目的选择数字代码(例如1、2、3、4),但原则上,只要与所定义的顺序相对应,它们就可以等同地为1、23、456、7890。在这两种情况下均采用均值将涉及按字面意义采用这些约定(即,似乎这些数字不是任意的,而是合理的),并且没有严格的依据。您需要一个区间刻度,在该区间刻度中可以从字面上采用值之间的相等差来证明采用均值是合理的。我将其作为主要论点,但正如已经指出的那样,人们经常无视它,因为无论测量理论家说什么,他们都觉得有用。

这是一个额外的示例。通常,人们被要求选择“强烈不同意” ...“强烈同意”中的一种,并且(部分取决于软件需要什么)研究人员将其编码为1 .. 5或0 .. 4或他们想要的任何东西,或者声明它作为有序因素(或软件使用的任何术语)。这里的编码是任意的,对回答问题的人是隐藏的。

但是通常还会以1到5的比例来问(说)人们如何评价某事?例子很多:网站,体育,其他竞赛以及教育。在这里,人们会看到一个秤,并被要求使用它。众所周知,非整数是有意义的,但是只允许您使用整数作为惯例。这是序数表吗?有人说是,有人说不。否则,问题的一部分就是序数尺度本身就是一个模糊或有争议的领域。

再考虑一下学术成绩,例如E到A。通常也会对这些成绩进行数字处理,例如1到5,人们通常会计算学生,课程,学校等的平均值,并对这些数据进行进一步分析。尽管对数字分数的任何映射都是任意的,但只要它能保持顺序就可以接受,但是在实践中,分配和接收分数的人们知道分数具有数字等价物,并且知道分数将被平均

使用均值的一个务实原因是中位数和众数通常是数据中信息的较差摘要。假设您有一个从完全不同意到完全同意的标度,为了方便起见,将第1点到第5点编码。现在假设一个样本编码为1,1,2,2,2,另一个为1,2,2,4,5。如果您认为中位数和众数是唯一合理的摘要,那是您的手,因为这是序数标度。现在,如果您发现平均值也有用的话,请举手,无论总和是否定义明确,等等。

自然,如果代码是1到5的正方形或立方体,则平均值将是一个高度敏感的摘要,例如,这可能不是您想要的。(如果您的目标是快速识别出较高的目标,那可能正是您想要的!)但这就是为什么使用带有连续整数代码的常规编码是一个实际的选择的原因,因为在实践中它通常效果很好。这与测量理论家无关,也不是什么论据,但数据分析人员应该对产生信息丰富的摘要感兴趣。

我同意任何人的意见:使用整个年级频率分布,但这不是问题所在。


1
好的答案和务实的态度很重要,但是我要提醒一提。仅使用正式建立的方法的一个很好的理由是,您可以访问确定性&c的估计。例如,如果我们有两个GPA(例如4.53和4.34),我们可能想知道一个GPA是否“显着”优于另一个。但是由于平均成绩缺乏形式化,我们没有得到置信区间&c之类的东西。
Stephen McAteer

1
@StephenMcAteer我会按照典型的介绍性课文或课程中讲授的方法来了解您的观点。但是,如果那是愿望,那么引导技术已经提供了一种允许置信区间持续近40年的技术。
尼克·考克斯

3

假设我们采用序数值,例如1表示强烈不同意,2表示不同意,3表示同意,4表示强烈同意。如果四个人给出答案1,2,3和4,那意味着什么?它是(1 + 2 + 3 + 4)/4=2.50。

当四人平均反应是“不同意或同意”时,应如何解释?这就是为什么我们不应该对均值数据使用均值。


3
稍微扮演恶魔的拥护者,在这个示例中,我将2.5解释为介于2(不同意)和3(同意)之间。鉴于我们“强烈不同意”与“强烈同意”,以及“不同意”与“同意”,这作为平均值是有意义的。
TooTone

1
在这种情况下,同意2.5的平均值对我仍然有意义-在不同意和同意之间,或者说是中立,介于中间。
卢西亚诺

3
我认为Azeem需要一个更强有力的例子。您可以基于相同的理由反对2.5个家庭的平均1,2,3,4个孩子的平均数,这怎么解释呢?因为它不是定义的值之一。这就提出了不同的问题。
Nick Cox

2
我认为您可以加强答案,并鼓励您这样做。在逻辑上或心理上,“因为均值可能是不确定的值”在这里并不是一个强有力的论点,并且也没有关注更深层次的问题,即平等差异是否真的意味着平等差异。
尼克·考克斯

1
我不知道如何使它更清晰,但是(例如)“ 0-4”,“ 5-19”,“ 20-114”是有序的(常规),因为这些测量只有一个自然的阶数(没有逆转)。如果您也想给他们打电话,我也很好。
Nick Cox

2

我完全同意@Azeem。但是,为了阐明这一点,让我进一步阐述一下。

假设您具有@Azeem示例中的序数数据,其比例范围为1到4。还假设您有几个人对此比例进行评分(例如Ice Cream)。假设您得到以下结果:

  • A人说4
  • 乙人说3
  • 人物C说1
  • D人说2

当您想要解释结果时,可以得出以下结论:

  • A人比B人更喜欢冰淇淋
  • D人比C人更喜欢冰淇淋

但是,您对评级之间的间隔一无所知。1和2之差与3和4之差是否相同?评分4是否真的意味着该人喜欢冰淇淋的人是将其评为1的人的4倍?依此类推...计算算术平均值时,将数字视为它们之间的差相等。但这是关于序数数据的相当强的假设,您必须证明其合理性。


我编辑了上面答案的参考。答案可以改变顺序,实际上上面的答案在下面是此刻,并且可以改变。因此,交叉引用海报而不是位置。
Nick Cox

0

我同意这样的概念,即算术平均值不能在序数规模数据中真正成立。在这种情况下,我们可以使用众数或中位数代替计算均值,这可以使我们对结果进行更有意义的解释。


这没有解决 为什么它可能不合适的问题。
尼克·考克斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.