什么是用于序数数据的良好基本统计数据?


67

我有一些从调查问题中获得的序数数据。在我的情况下,它们是李克特风格的回应(强烈不同意-不同意-中立-同意-强烈同意)。在我的数据中,它们被编码为1-5。

我认为均值在这里意义不大,那么什么基本的汇总统计数据被认为有用呢?


2
常见选择包括-每组的中位数,
众数

Answers:


29

频率表是一个很好的起点。您可以计算每个级别的计数和相对频率。同样,总数和缺失值的数量也可能有用。

您还可以使用列联表一次性比较两个变量。也可以使用镶嵌图显示。


32

我将从应用的角度进行争论,即平均值通常是总结李克特项目集中趋势的最佳选择。具体来说,我正在考虑诸如学生满意度调查,市场调查量表,员工意见调查,人格测验项目以及许多社会科学调查项目之类的上下文。

在这种情况下,研究的消费者通常希望回答以下问题:

  • 哪些陈述相对于其他陈述具有或多或少的共识?
  • 哪些团体或多或少同意给定的陈述?
  • 随着时间的流逝,协议上升还是下降?

出于这些目的,均值具有几个好处:

1.平均值易于计算:

  • 很容易看到原始数据和均值之间的关系。
  • 实用上很容易计算。因此,均值可以轻松地嵌入到报告系统中。
  • 它还促进了上下文和设置之间的可比性。

2.意思是相对容易理解和直观的:

  • 该平均值通常用于报告李克特项目的集中趋势。因此,研究的消费者更有可能理解均值(从而信任均值并对其采取行动)。
  • 一些研究人员更喜欢使用可能更为直观的​​方法来报告回答4或5的样本的百分比。即,它具有相对直观的“百分比协议”解释。本质上,这只是均值的另一种形式,带有0, 0, 0, 1, 1编码。
  • 而且,随着时间的流逝,研究的消费者会建立参考框架。例如,当您逐年或跨学科比较教学表现时,您会对3.7、3.9或4.1的平均值有细微的了解。

3.平均值是一个数字:

  • 当您要提出诸如“学生对科目X比科目Y更满意”这样的说法时,单个数字特别有价值。
  • 从经验上我也发现,一个数字实际上是李克特项目中感兴趣的主要信息。标准偏差往往与平均值接近中心评分(例如3.0)的程度有关。当然,根据经验,这可能不适用于您的情况。例如,我在某处读到,当You Tube评级具有星级系统时,会有很多最低或最高评级。因此,检查类别频率很重要。

4.没有太大的区别

  • 尽管我尚未对其进行正式测试,但我会假设,为了比较各个项目,一组参与者或一段时间内的中心趋势评分,为生成平均值而进行的任何合理的比例选择都会得出相似的结论。

4
好贴!您是否对不同的文化/国家如何使用李克特量表有什么想法,这会严重影响这些结果?
大通

@chase对此进行了研究,但是自从我查看以来已经有一段时间了。这是Google学者Scholar.google.com.au/…
Jeromy Anglim

我同意杰里米·安格利姆(Jeromy Anglim)先生关于使用均值(即准确的加权均值)作为有序分类变量的最可靠,无偏见的描述的理由,例如使用Likert量表,其中每个数据点均对最终平均值。


28

对于基本摘要,我同意报告频率表和一些有关集中趋势的指示是可以的。作为推断,最近发表在PARE上的一篇文章讨论了t检验与MWW检验,五点李克特项目:t检验与Mann-Whitney-Wilcoxon

对于更详尽的处理,我建议阅读Agresti关于有序分类变量的评论:

Liu,Y和Agresti,A(2005)。有序分类数据的分析:概述和最新发展概况考试与评估学院学报,14(1),1-73。

它在很大程度上超越了通常的统计数据,例如基于阈值的模型(例如,比例赔率),值得代替Agresti的CDA书来阅读。

下面我展示了三种处理李克特物品的方法。从顶部到底部分别是“频率”(标称)视图,“数字”视图和“概率”视图(部分信用模型):

替代文字

数据来自包装中与技术有关的Science数据(“新技术不依赖于基础科学研究”,在四点范围内回答为“强烈不同意”至“强烈同意”)ltm


14

常规做法是使用非参数统计等级和平均等级来描述序数数据。

它们的工作方式如下:

排名总和

  • 为每个组中的每个成员分配一个等级;

  • 例如,假设您正在为两个相对的橄榄球队的每个球员寻找目标,然后从头到尾对这两个球队的每个成员进行排名 ;

  • 通过将每个组的等级相加来计算等级总和;

  • 等级总和的大小告诉您每个组的等级有多接近

平均排名

M / R比R / S更复杂的统计信息,因为它可以补偿要比较的组中不相等的大小。因此,除了上述步骤之外,您还需要将每个总和除以组中成员的数量。

有了这两个统计数据后,您就可以例如对秩和进行z检验,以查看两组之间的差异是否具有统计显着性(我相信这被称为Wilcoxon秩和检验,该检验可以互换,即在功能上相当于Mann-Whitney U检验)。

R这些统计信息的功能(无论如何我都知道):

标准R安装中的wilcox.test

meanranks曲柄


3

基于摘要本文可能有助于比较几个Likert量表变量。它比较了两种类型的非参数多重比较测试:一种基于排名,另一种基于Chacko的测试。它包括模拟。


目前,这几乎是@PeterFlom的评论。尽管ACM数字图书馆可能不太容易受到链接腐烂的影响,但您是否愿意对文章发表一些看法,也许是它提供的有用信息的前提?
gung

2
@gung,您好,我不确定在此长线程中的何处放置注释。自从今天发布的问题关闭以来,我在这里添加了引文,这篇文章似乎很有用(并涵盖了我在其他地方未曾看到的问题)
Peter Flom

2

我通常喜欢使用马赛克图。您可以通过合并其他感兴趣的协变量来创建它们(例如:性别,分层因素等)


2

我同意Jeromy Anglim的评价。请记住,李克特反应是估计值–您没有使用完全可靠的标尺来测量尺寸稳定的物理对象。当使用合理的样本量时,平均值是一种有力的度量。

在业务和产品研发中,平均值是迄今为止与李克特量表一起使用的最常用统计量。在使用李克特量表时,我通常会选择一种最适合研究问题的量度。例如,如果您在谈论“偏好”或“态度”,则可以使用多个基于李克特的指标,每个指标提供的见解都略有不同。

iX


1

“盒子分数”通常用于总结序数数据,特别是在带有有意义的语言锚的情况下。换句话说,您可能会报告“前2个框”,即选择“同意”或“强烈同意”的百分比。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.