显示有序数据-均值,中位数和均值等级


11

我有一些顺序数据不是正态分布的,所以我决定使用Mann-Whitney U检验进行非参数检验。我正在寻找七个分数的组间差异-每个主题的分数分别为0、1、2或3。我很难弄清楚如何显示我的数据!

如果我使用中位数(和中位数的IQR)显示数据,那么根本就不清楚差异在哪里,因为在大多数情况下,中位数落在0或1上。因此,尽管Mann-Whitney U检验显示出显着差异,桌子看起来没意思。

我也可以使用手段呈现数据。那里有一些科学论文说,您可以使用具有序数数据的均值,但是不能对分数之间的差异做出相同类型的假设(例如0和1之间的差异与1和1之间的差异不相同) 2)。尽管表中的数字很好地说明了我使用它们时的故事,但使用方法会引起一些争议。

第三种选择是使用SPSS在曼恩·惠特尼(Mann-Whitney)输出中给我的平均排名。平均等级是各组之间正在比较的,所以也许我应该使用那些?我唯一遇到的问题是,平均排名对实际数据没有任何意义(例如,使用平均等级,我看不到对象更接近3,而控件更接近1。)

最后的选择是在将得分分为两组(低分为0和1,高分为2和3)后,比较受试者和对照者进行卡方分析。但是,当我这样做时,差异并不明显(可能是由于多种原因)。


您是否在问如何最好地以文本,表格或图形形式显示数据?
gung-恢复莫妮卡

文本和表格。在本文中,我要说的是,在我的睡眠调查的几个组成部分中,各组之间存在显着差异。这些差异是通过曼恩·惠特尼(Mann-Whitney)检验进行的,因此他们正在比较平均排名。我不知道如何在表格中显示这些差异。使用中位数无效,因为它们太相似了,您看不到差异。均值效果更好,但是在表中使用参数量度似乎很奇怪,该表应该是非参数中位数。平均排名会起作用,但并不代表实际价值。
埃里克

1
我想知道Graph中关于两个序数变量之间关系的一些答案是否可以适应您的目的?示例图显示了两个变量之间的关系,每个变量具有五个级别,但是,例如,如果要比较两个组,并且有四个可能的级别,则可以将这些可视化中的一些可视化为4-by-2而不是5-by- 5,也许。
Silverfish

如果您可以发布一些(可能完全是伪造的)示例数据可能会有所帮助,以便希望演示一种可能技术的人员可以使用一些东西。
Silverfish

1
埃里克(Eric)按照定义是非参数检验,尤其是曼恩·惠特尼(Mann-Whitney),通常比较(对于优势)两个分布,它不比较分布的特定参数值,例如均值或中位数。在这种情况下,不存在任何单一数字,它是分布的特征,并且同时是要比较的数字。您可以使用Hodges-Lehmann 2样本估计量,但这是两个分布之间差异的特征,而不是两个分布中每个分布之间的差异。
ttnphns 2015年

Answers:


8

这是一个很好的问题。如您所见,当数据中有许多联系时,分位数不起作用,因为它们作为估计量太不连续了。如果您可以假设类别之间的间隔至少是“有意义的”,那么我通常会发现最有效的方法。超出概率始终有效。在您的情况下,可以通过观察的比例进行估算。在比较组时,平均排名很有用,但我认为单个变量没有太多用处。1,2,=3

用均值总结序数变量的正确性很少来自数据本身。这是主观的。

我将使用适当的等级相关性度量或一致性概率(Wilcoxon-Mann-Whitney统计信息的简单线性转换;这是两组中观察值的平均等级除以一个常数),而不是使用平均等级。两个变量(例如,二进制分组和序数标度)。相关系数的选择包括(与一致性概率一致,并且对序数变量进行平分)和Goodman-Kruskal不对或。 γ X ÿDxyγxy


1
嗨,弗兰克,谢谢您的周到答复。如果您不介意,我还有几个后续问题。关于手段-我认为这些类别至少是有意义的,因为它们基本上分别指的是“无,轻度,中度和重度障碍”。您是否知道我可以以此为先例的参考文献?我也很犹豫只在一个表中使用均值,而在其他表中使用中位数以保持一致性。对于平均排名-我相信我正在比较各组-受试者与对照组的7分。比较均值等级是否可接受/有用?
埃里克

对于水平数少的数字序数数据(例如计数和可能的损伤示例),均值是有用的,而中位数则无用(因为有太多的联系)。在很多情况下,我在同一张表中使用均值表示序数数据的平均值和中值表示连续偏斜的平均值。
弗兰克·哈雷尔
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.