是否可以有效地减少已发布的李克特量表中的项目数?


11

[根据反馈进行的编辑-谢谢:-)]

h!更多编辑!抱歉!

你好-

我正在进行一些相当粗略和现成的数据收集,并使用已发布的有关士气和其他此类问题的量表发送给医护人员的调查。

唯一的问题是,与调查中的所有其他内容相比,该比例尺相当长,我想通过将每个子比例尺切成一半并且仅使用一半的项目来减小其尺寸。我的直觉是,这很好,因为子量表是相互关联的,虽然对于出版标准的研究不是理想的选择,但对于组织内部的一些事实调查也可以。

我想知道是否有人对这样做的有效性,陷阱或其他事情有任何想法。特别感谢您提供参考,因为我的同事们需要说服力!

非常感谢Chris B

编辑-

是的,它是经过验证的具有已知心理特征的量表。

如果这是正确的放置方式,则它是一维的并且具有子刻度。

我将在子级别和总级别(而不是项目级别)进行工作。

30个项目,大约40-60个人。

干杯!


这是经过验证的,具有已知心理特征的量表吗?
chl 2010年

克里斯,您好,您并不是在减少李克特量表中的项目数量,而是使用更少的问题/项目(以李克特量表衡量)。一般来说,这听起来取决于您的措施。您可以检查要删除的项目与要保留的项目之间的相关性。如何衡量要删除的数量实际上是一个有趣的问题-可能值得以这种方式重新构建问题(如果您不愿意,我可能以后再做)。好问题:)
Tal Galili 2010年

其他三个问题:(1)这是一维量表还是有几个子量表;(2)个人的数量和件数是多少?(3)您是在件的层级还是总层级上工作?或平均分数?
chl 2010年

Answers:


11

尽管仍然缺少一些信息(每个次级量表的人数和物品数量),但这里还是一些有关减小规模的一般提示。另外,由于您是在调查问卷级别上工作,所以我不明白为什么它的长度如此重要(毕竟,您只会提供汇总统计信息,例如总分或均值)。

我将假设(a)您有一组K项,它们测量与士气有关的某些构造,(b)您的“一维”量表是一个二阶因子,可以细分为不同的方面,(c)您想将您的量表减少到k <K个项目,以便在保持量表内容有效性的同时,以足够的准确性汇总受试者的总量表分数。

关于此经过验证的量表的内容/结构有效性:当然已经选择了项目数,以最好地反映出所关注的结构。通过缩短调查问卷,您实际上正在减少构建的覆盖范围。仅考虑一半项目时,最好检查因子结构是否保持不变(毕竟,这也可能影响选择它们的方式)。这可以使用传统的FA技术来完成。您有责任以类似于作者的精神来解释量表。

关于分数可靠性:尽管这是一种与样本有关的度量,但是当减少项目数时,分数可靠性会下降(请参阅Spearman-Brown公式)。另一种观察方法是标准测量误差(SEM)会增加,但是请参见Leo M Harvill 撰写的NCME标准测量误差指导模块。不用说,它适用于取决于项目数量的每个指标(例如,可用于估计一种形式的可靠性即内部一致性的Cronbach's alpha)。希望这不会影响任何基于原始分数的组间比较。

因此,我的建议(最简单的方法)是:

  1. 选择您的项目,以最大程度地扩大构造范围;用FA检查维度,并使用单变量响应分布检查覆盖范围;
  2. 将平均项目间相关性与先前报告的相关性进行比较;
  3. 计算完整比例和您的复合材料的内部一致性;检查它们是否与原始规模的已发布统计数据相符(无需进行任何测试,这些都是依赖于样本的度量);
  4. 测试原始分数和简化分数(子分数)之间的线性(或多变量或等级)相关性,以确保它们具有可比性(即,通过原始分数可以看出,潜伏性状上的个体位置没有很大变化) );
  5. 如果您有特定于主题的外部变量(例如,性别,年龄或最好的与士气有关的量度),请比较两种形式之间的已知群体效度

困难的方法是依靠项目响应理论来选择那些携带有关潜在特征的信息最多的项目-缩减规模实际上是其最佳应用之一。多线程项目的模型在此线程中进行了部分描述,即“ 验证问卷”

第二次更新后更新

  1. 无需再为主题如此之少的多模项目准备任何IRT模型。
  2. 因子分析也将遭受如此低的样本量的困扰。您将获得不可靠的因子负荷估算值。
  3. 30项除以2 = 15项(很容易就知道总分的相应SEM有所提高),但是如果考虑子量表的话,那肯定会变得更糟(这实际上是我的第二个问题-否。每个分量表)

8

我想您的问题没有明确的“是/否”答案。如果您随意从子量表中删除项目以创建原始问卷的简短形式,则会失去长形式的心理计量学验证。可能发生变化的是问卷的阶乘结构,子量表的可靠性,项目间的相关性等(您会注意到,我习惯于经典的测试理论思维,而不是IRT)。另外,您不能使用原始问卷的任何标准化方法。这就是为什么简短形式的既定问卷必须经过单独的验证阶段。

根据您的要求,所有信息都不会丢失。您可能不需要标准化,因为您可能只想比较样本中的结果,而无需对参考群体做出“绝对”判断。恕我直言,如果您有机会至少对小组的子样本使用原始格式来验证简短格式,那将是一个加号。这可以让您查看结果是否相似。

通常,问卷的结果对其项目构成可能会出乎意料的敏感。人们不是自动填写调查表,而是做出各种默认的假设和认知推断:“这到底是什么?”,“我希望在这里报告什么?”,“他们实际上想知道什么?”。这在很大程度上取决于给定项目的上下文,请参见。Schwarz,N.,1996年。认知与交流:判断偏差,研究方法和对话逻辑。新泽西州Mahwah:劳伦斯·埃尔鲍姆(Lawrence Erlbaum)。


4

我要加一分。

注意组别(例如,随时间推移比较组平均值)和个人水平测量(例如,将量表上的得分与个人水平上的其他量表相关联)之间的区别。

可靠性对两个级别的适用方式有所不同。以下简化可能会有所帮助:

  • 组级别度量的可靠性在很大程度上受您拥有的参与者数量以及组级别上真正可变性的程度的影响。
  • 个人水平测量的可靠性在很大程度上受您拥有的物品数量以及个人真正变化的程度的影响。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.