验证问卷


12

我正在为我的论文设计问卷。我正在验证问卷的过程中,已将Cronbach's alpha检验应用于初始样本组。对问卷的回答是李克特量表;任何人都可以建议任何进一步的测试来帮助测试其有效性。我不是统计学专家,所以我们将不胜感激。

我一直在做一些研究,似乎可以进行Rasch分析了,有没有人有免费的软件站点可以应用此测试和建议?

Answers:


22

我假设您的问卷将被视为一个一维量表(否则,Cronbach的alpha值就没有太大意义了)。值得进行探索性因素分析以进行检查。它还将允许您查看项目与比例的关系(即通过它们的负载)。

验证商品和规模的基本步骤应包括:

  • 有关项目基本统计信息的完整报告(范围,四分位数,集中趋势,上限和下限效应(如果有));
  • 像检查alpha一样检查内部一致性(最好,给出95%的置信区间,因为它取决于样本);
  • 用通常的统计数据(直方图+密度,分位数等)描述您的摘要度量(例如,总分或平均分,又称量表分);
  • 根据可能与您正在评估的结构相关的特定协变量来检查您的汇总响应-这称为已知组有效性;
  • 如果可能的话,对照旨在衡量同一结构(并发或收敛有效性)的已知工具,检查您的简要回答。

如果您的尺度不是一维尺度,则必须对每个子尺度进行这些步骤,并且您也可以将因子的相关矩阵作为因子,以评估二阶因子结构(或使用结构方程模型或验证性因子分析,或任何你想要的)。您还可以通过使用多特征缩放或多特征多方法建模(基于尺度内和尺度之间的项目间相关性)或SEM来评估收敛性和判别有效性。

然后,我想说的是,除非您有兴趣缩短问卷,过滤掉某些显示出不同项目功能的项目,或者将您的测试用于某种计算机自适应测试,否则项目响应理论将无济于事。

无论如何,Rasch模型用于二进制项。对于多项订购商品,最常用的模型是:

  • 分级反应模型
  • 部分信用模型
  • 评级量表模型。

只有后两个来自Rasch家族,并且它们基本上使用相邻的赔率表述,其想法是受试者必须“通过”多个阈值才能认可给定的响应类别。这两个模型之间的区别在于PCM不会强加阈值在theta(能力或潜质特征上的对象位置)尺度上等距分布。分级响应模型依赖于累积赔率公式。请注意,这些模型都假设比例尺是一维的。即,只有一个潜在的特征。存在其他假设,例如局部独立性(即,响应之间的相关性通过能力规模的变化来解释)。

无论如何,在《统计软件杂志:特殊卷: R中的心理计量学》的第20卷中,您会在R中找到非常完整的文档和使用心理测量方法的有用线索。基本上,我在日常工作中使用的最有趣的R包是:ltmeRmpsychpsy。其他参考了CRAN任务视图Psychometrics。其他感兴趣的资源是:

可以在实践中的量表构建和评估中找到有关FA与IRT在量表开发中的使用的很好综述:十个Holt等人(心理测试和评估模型(2010)对因素分析与项目反应理论应用的综述)。 52(3):272-297)。


11

在支持上述所有内容的同时,我建议您执行以下操作(以足够的顺序进行)

首先,您应该使用R,否则请启动。以下建议基于R的使用。

我假设此时您已经计算了描述性统计数据等。如果没有,心理包有一个describe()函数,该函数应该为您提供所需的统计信息。

从CRAN安装psych软件包。加载心理包。在数据上使用fa.parallel例程。这应该给您保留许多因素。然后,使用VSS(例程)。这将计算MAP标准,从而为您提供不同数量(通常)的要保留的因子。对每种数量的因子使用一种因子分析形式(不是主要成分),并进行倾斜旋转。如果倾斜旋转后您的因子似乎不相关,请切换为正交旋转。这是因为可以从倾斜旋转确定正交结构,但反之则不能。

提取MAP准则和并行分析准则之间的所有因子解。确定其中哪一个具有最合适的索引并最有意义。这是您应该保留的那个。

在IRT中,同时使用ltm和eRm,我建议从eRm开始。它为您的模型提供了更好的图形功能,并且对多模型的支持更大。话虽如此,它仅适合Rasch模型,而心理调查问卷中的数据通常无法满足其要求。祝好运!心理计量学很有趣,您无疑会发现。


1
(+1)听起来不错。感谢您分享有关IRT建模和FA的经验。除了图形功能之外,eRm中的条件方法更符合Rasch最初对theta的想法(作为固定参数)。
chl 2010年

1

验证调查表意味着证明它可以衡量应衡量的内容。因此,我想说,这主要不是一个统计问题,如果不知道您的问卷的具体内容就无法回答。Cronbach alpha与有效性无关,而是与内部一致性有关,内部一致性在某种程度上与可靠性有关(或者可以假设您的问题是可互换的,这就是可靠性,但事实并非如此)。

那么,您可以做什么来验证您的问卷?您可以研究哪些心理过程导致了特定的结果模式(例如,通过尝试通过实验操作或使用思考方式程序[“协议分析”,爱立信与西蒙,1992年)来诱导这种模式)。或比较应该有不同分数的一些对比组(例如,有对照的患者)。或将其与应该与您正在测量的特征相关联的外部标准相关联。或通过Psychoscope(TM)测量特征,并将其用作标准。

其他答案在指出您可能可以实际执行的操作时更有用-即使严格地讲,其中大多数与有效性无关(例如Chi提到“已知组有效性”和外部有效性)。

另请参阅Markus&Borsboom(2013),以现代方式了解有效性(此内容和其他有用的参考文献@ Borsboom的主页)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.