评估问卷的可靠性:维度,有问题的项目以及是否使用alpha,lambda6或其他某种指数?


16

我正在分析参加实验的参与者给出的分数。我想估计问卷的可靠性,该问卷由6个项目组成,旨在估计参与者对产品的态度。

我计算了克朗巴赫(Cronbach)的alpha值,将所有项目视为一个比例(alpha约为0.6),并一次删除了一项(最大alpha约为0.72)。我知道,根据项目的数量和底层构造的维数,alpha可能会被低估和高估。因此,我还执行了PCA。该分析表明,有三个主要成分解释了大约80%的方差。所以,我所有的问题都是关于我现在该如何进行?

  • 我是否需要在每个维度上执行alpha计算?
  • 我是否已移除影响可靠性的物品?

此外,在网上搜索时,我发现还有另一种可靠性度量:guttman的lambda6。

  • 此度量与alpha的主要区别是什么?
  • lambda的高价值是什么?

只是为了确保我理解正确:PCA找到6个项目= 3个尺寸?
chl

1
(1)您的样本量是多少?(2)标尺是否设计成一维的?(3)是否通过标准评分程序很好地建立了量表?
Jeromy Anglim 2011年

Answers:


19

我认为@Jeromy已经说过基本要点,因此我将专注于可靠性的度量。

克朗巴赫(Cronbach)α是一种取决于样本的指数,用于确定仪器可靠性的下限。它仅是在计算量表分数时考虑的所有项目共享的方差指标。因此,不应将其与绝对的可靠性度量相混淆,也不应将其整体上应用于多维仪器。实际上,做出以下假设:(a)没有剩余相关性,(b)项具有相同的负载,并且(c)比例是一维的。这意味着alpha基本上与可靠性是均匀高因子加载,无误差协方差和一维仪器的情况(1)。由于其精度取决于项目相关性的标准误差,因此取决于项目相关性的分布,这意味着alpha会反映此相关性范围,而不管此特定范围的一个或多个来源(例如,测量误差或多维性)。这一点在(2)中有很大的讨论。值得注意的是,当alpha为0.70(用于组比较目的的广泛使用的可靠性阈值(3,4))时,测量的标准误差将超过标准偏差的一半(0.55)。此外,Cronbach alpha是内部一致性的度量,它不是一维的度量,不能用来推断一维(5)。最后,我们可以引用LJ Cronbach本人的话,

系数是一种粗略的工具,不会将方差分量所隐含的许多细微之处浮出水面。特别是,当前评估中所做的解释最好通过使用标准测量误差进行评估。-Cronbach和Shavelson,(6)

在过去的十年中,有许多其他陷阱在许多论文中进行了广泛讨论(例如7-10)。

λ3λ6ωŤωHβ

参考文献

  1. Raykov,T。(1997)。秤的可靠性,克朗巴赫系数α和固定的同类零件的基本tau等效性违规。多元行为研究,32,329-354。
  2. 科尔蒂纳,JM(1993)。什么是系数阿尔法?理论与应用的检验应用心理学杂志,78(1),98-104。
  3. 纽纳利(JC)和伯恩斯坦(IH)(1994)。心理测量学。麦格劳-希尔心理学系列,第三版。
  4. De Vaus,D.(2002年)。分析社会科学数据。伦敦:Sage出版物。
  5. 丹尼斯(Jes)和曼(Mann),好的。(1984)。具有潜在变量的一维测量和结构方程模型。商业研究杂志,12,337-352。
  6. Cronbach,LJ和Shavelson,RJ(2004)。我目前关于系数α和后续过程的思想教育与心理测量,64(3),391-418。
  7. Schmitt,N。(1996)。系数α的使用和滥用心理评估,8(4),350-353。
  8. Iacobucci,D。和Duhachek,A。(2003)。推进Alpha:信心十足地衡量可靠性消费者心理学杂志,13(4),478-487。
  9. Shevlin,M.,Miles,JNV,Davies,MNO和Walker,S.(2000年)。系数alpha:可靠性的有用指标? 人格与个体差异,第28卷,第229-237页。
  10. Fong,DYT,Ho,SY,and Lam,TH(2010)。存在不一致反应时的内部可靠性评估健康和生活质量成果8,27
  11. 古特曼,L。(1945)。分析重测可靠性的基础。心理疗法,10(4),255-282。
  12. αβωH
  13. Revelle,W。和Zinbarg,RE(2009)系数alpha,beta,omega和glb:对Sijtsma的评论心理疗法,74(1),145-154

8

以下是一些一般性评论:

  • PCA:PCA分析不会“揭示出三个主要组成部分”。您选择提取三个维度,或者依靠一些默认的经验法则(通常特征值超过1)来确定要提取多少个维度。另外,一个以上的特征值通常会提取出比有用的更多的维。
  • 评估物品的尺寸:我同意您可以使用PCA评估物品的尺寸。但是,我发现查看碎石图可以为维数提供更好的指导。您可能想查看William Revelle撰写的页面,有关评估尺度尺寸
  • 如何进行?
    • 如果比例尺很好,则您可能希望保持原样(假设其属性至少合理;尽管在大多数情况下,0.6相对较差)。
    • 如果比例表没​​有很好地确定,则理论上应该考虑要测量的项目以及要使用最终比例表的目的。由于只有六个项目,因此没有太多空间可以创建多个秤,而不必担心每个秤的项目数量。同时,根据地板,天花板或低可靠性问题检查是否有问题的项目是一个明智的主意。另外,您可能要检查是否需要撤消任何项目。
    • 我整理了一些有关规模开发的一般资源的链接,这些链接可能会对您有所帮助

以下内容解决了您的特定问题:

  • 我是否需要在每个维度上执行alpha计算?
    • 从以上讨论中您可能会发现,我认为您不应将数据视为具有三个维度。您可以根据自己的目的和详细信息进行一系列参数选择,因此很难确切地说出要做什么。在大多数情况下,我希望创建至少一个良好的比例(也许删除一个项目),而不是三个不可靠的比例。
  • 我是否已移除影响可靠性的物品?
    • 由你决定。如果比例已建立,则可以选择不选择。如果样本量较小,则可能是随机抽样的异常。但是,一般来说,如果某个项目确实将您的alpha值从0.72降至0.60,则我倾向于删除该项目。我还要检查这个有问题的项目实际上不是要撤消的。

我将把关于lambda 6的讨论(此处由William Revelle讨论)留给其他人。


尊敬的Jeromy,谢谢您的及时答复。我有点困惑。在该论坛上阅读了几篇论文和文章后,我发现探索性因素分析还用于探究是否可以将问卷视为一维量表。因此,我想知道哪种方法最合适(PCA或EFA)。你能帮助我吗?谢谢
giovanna 2011年

1
@ giovanna好问题。您可能要问一个关于此特定问题的单独问题。总的来说,我认为确定尺寸是一门艺术。从实践的角度来看,无论我是进行PCA还是EFA,我都倾向于获得相似的结果,但是从理论上讲,EFA与引起观察项的潜在因素的概念更加吻合。
Jeromy Anglim 2011年

@giovanna对此表示感谢:后续问题的链接是stats.stackexchange.com/questions/11713/…对于其他可能感兴趣的人
Jeromy Anglim 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.