将n点李克特量表数据视为来自二项式过程的n次试验是否合适?


11

我从来没有喜欢过人们通常如何分析李克特量表的数据,就像人们有合理的期望至少在量表的极端情况下违反了这些假设一样,误差是连续的和高斯的。您如何看待以下替代方案:

如果响应在n点尺度上取值为,则将该数据扩展到n个试验,其中k 试验的值为1,n - k其试验的值为0。因此,我们将李克特量表的响应视为如果它是一系列二项式试验的秘密集合(实际上,从认知科学的角度来看,这实际上是此类决策场景中所涉及机制的吸引人模型)。使用扩展的数据,您现在可以使用混合效应模型,将响应者指定为随机效应(如果有多个问题,还可以将问题指定为随机效应),并使用二项式链接函数指定误差分布。knnknk

任何人都可以看到这种方法的任何假设违规或其他有害方面吗?


2
您是否知道有任何发表过的研究探讨使用李克特量表作为时间间隔或序数数据的相对优势?也许,将它们视为区间水平标度的缺陷还不够严重,不足以保证采用复杂的方法。如果真是这样,那么您的方法可能只是简单地追求目标。

Answers:


16

在心理学文献中,我不知道有任何与您的问题相关的文章。在我看来,允许随机效应成分的有序逻辑模型可以很好地处理这种情况。

我同意@Srikant的观点,认为比例赔率模型或有序概率模型(取决于您选择的链接函数)可能会更好地反映Likert项目的内在编码,以及它们在意见/态度调查或问卷调查中通常用作评分量表。

其他替代方法是:(1)使用相邻类别而不是比例类别或累加类别(与对数线性模型有联系);(2)使用项目响应模型,例如部分信用模型或评分量表模型(正如我在Likert量表分析中的响应中所提到的)。后一种情况可与混合效应方法相比较,将受试者视为随机效应,并且可以在SAS系统中轻松获得(例如,使用NLMIXED程序拟合混合效应模型以用于重复序数结局)或R(参见第一卷)。 20中的杂志统计软件)。您可能也对John Linacre提供的有关优化评级量表类别有效性的讨论感兴趣。

以下论文也可能有用:

  1. Wu,CH(2007)。李克特量表数据向数值分数转换的实证研究应用数学科学1(58):2851-2862。
  2. Rost,J和Luo,G(1997)。基于Rasch的展开模型在青少年中心主义问卷中的应用。在Rost,J和Langeheine,R(编辑)的《潜在特质和潜在类别模型在社会科学中的应用》,纽约:Waxmann。
  3. Lubke,G和Muthen,B(2004)。在多元正态性假设下对李克特量表数据进行因子分析会使观察到的群体或潜在类别的有意义的比较复杂化结构方程建模11:514-534。
  4. Nering,ML和Ostini,R(2010)。多项项目反应理论模型手册。Routledge学术
  5. Bender R和Grouven U(1998)。对具有非比例赔率的序数数据使用二进制逻辑回归模型。临床流行病学杂志51(10):809-816。(找不到pdf,但此可用,医学研究中的序数逻辑回归

1
R中还提供了带有序数包和clmm()的混合效果序数逻辑回归。
约翰

9

如果您真的希望放弃关于李克特量表的区间水平数据的假设,我建议您假设该数据是有序logit或probit。李克特量表通常用于衡量反应的强度,因此,较高的值应表示对相关基础项目的反应较强。

HS

y=1Sα1

y=h αh1<S αhh=2,3,..H1

y=H αH1<S< 

S


2

npnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
我记得一些研究似乎可以证明这一点:Coelho&Esteves(2006),“在客户满意度测量的框架中,在五点和十点之间进行选择”。

1

如果将同意并强烈同意合并为一个组,将不同意并强烈不同意的合并为另一组,则可以在5点李克特量表中使用二项式近似。当然,您仍然需要确定中立者的去向。我将把中性点放在任何一组中,使用二项式的正态近似值(假设您有40个以上的响应),并对每个组的比例建立置信区间(请参阅有关如何获得置信度的任何标准统计文本。来自二项分布的正态近似比例区间)。然后,我将中性点放在另一组中,并重做置信区间。如果我从两者得出相同的结论,那么就有可能得出结论。否则,我看不到如何将二项式与李克特数据一起使用。


0

如果我理解正确,则本文提出了一种与您所描述的方法非常相似的方法,表明是的,确实,类似李克特的数据可能来自二项式过程。

参考文献:Allik,J.(2014)。李克特型人格测度的混合二项式模型。心理学前沿,(5)371


欢迎光临本站!您能为该论文添加完整参考吗?这是标准做法,因为链接往往会失效。
mkt-恢复莫妮卡

-1

实际上,我正在准备一份论文,其中我正在使用您的方法来处理关于李克特项目的答复,就好像它是一系列秘密二项式试验的公开总和。

在我的论文中,使用二项式分布来解释观察到的频率分布的形状。该方法背后的原理有两个假设。在许多小程序中,显示出二项式分布是如何存在的,人们通过单个球落入一组销钉来重复进行独立的伯努利试验。每次球落到销钉上时,它将以概率p向右反弹(即成功),或以概率1-p向左反弹(即失败)。球落入阵列后,球落在标有相应成功次数的箱子中。在我的论文中,决策过程也被视为一系列重复的独立伯努利试验,其中在每次试验中,受试者都决定同意或不同意所讨论的陈述。

(i)在每次独立的伯努利试验中,受试者均决定同意概率p或不同意(不同意)概率1-p。

(ii)如果对陈述有五种回答,那么就同意或不同意(不同意)的决定作出的伯努利决定的次数等于4(5-1)。

以下规则给出了特定响应类别的最终选择。

  • 如果在所有(四种)情况下都做出伯努利同意的决定,那么将给出“强烈同意”的回答。

  • 如果在三种情况下做出了伯努利同意的决定,则将给出“同意”响应。

  • 如果在两种情况下做出了伯努利同意的决定,那么将给出“不确定”的响应。

  • 如果仅在一种情况下做出伯努利同意的决定,则将给出“不同意”的响应。

  • 如果在任何情况下都没有做出伯努利同意的决定,那么将给出“强烈不同意”的回答。

使用“不同意”的决定可以给出类似的推理。为了获得二项式分布,响应类别的评分如下。

强烈不同意= 0,不同意= 1,中立= 2,同意= 3,强烈同意= 4

如果被访者之间没有系统的差异,这两个假设将导致响应频率的二项式分布。

我希望你能同意。如果您能在上述文章中提高我的英语水平,我会非常感谢。


我已删除了您的较早答复。请注意,我的评论并非要否定。单行答复通常不是很有帮助,首选可争论的答案(但请参阅我们的常见问题解答)。
chl 2012年

1
这是一个有趣且富有创意的提议,但我对此表示怀疑。在您建议的版本和按顺序进行的Logistic回归中,例如,该线程中的其他建议(例如,该线程上的其他人都将需要按比例赔率进行假设)。但是,我相信OLR允许阈值/临界点b / t更加灵活地变化,而它们将由方案中的二项式参数&确定。我必须怀疑这一假设是否符合数据,我怀疑这会导致问题。(顺便说一句,-1不是来自我。)ñpn
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.