Answers:
我假设您的问卷将被视为一个一维量表(否则,Cronbach的alpha值就没有太大意义了)。值得进行探索性因素分析以进行检查。它还将允许您查看项目与比例的关系(即通过它们的负载)。
验证商品和规模的基本步骤应包括:
如果您的尺度不是一维尺度,则必须对每个子尺度进行这些步骤,并且您也可以将因子的相关矩阵作为因子,以评估二阶因子结构(或使用结构方程模型或验证性因子分析,或任何你想要的)。您还可以通过使用多特征缩放或多特征多方法建模(基于尺度内和尺度之间的项目间相关性)或SEM来评估收敛性和判别有效性。
然后,我想说的是,除非您有兴趣缩短问卷,过滤掉某些显示出不同项目功能的项目,或者将您的测试用于某种计算机自适应测试,否则项目响应理论将无济于事。
无论如何,Rasch模型用于二进制项。对于多项订购商品,最常用的模型是:
只有后两个来自Rasch家族,并且它们基本上使用相邻的赔率表述,其想法是受试者必须“通过”多个阈值才能认可给定的响应类别。这两个模型之间的区别在于PCM不会强加阈值在theta(能力或潜质特征上的对象位置)尺度上等距分布。分级响应模型依赖于累积赔率公式。请注意,这些模型都假设比例尺是一维的。即,只有一个潜在的特征。存在其他假设,例如局部独立性(即,响应之间的相关性通过能力规模的变化来解释)。
无论如何,在《统计软件杂志:特殊卷: R中的心理计量学》的第20卷中,您会在R中找到非常完整的文档和使用心理测量方法的有用线索。基本上,我在日常工作中使用的最有趣的R包是:ltm,eRm,psych,psy。其他参考了CRAN任务视图Psychometrics。其他感兴趣的资源是:
可以在实践中的量表构建和评估中找到有关FA与IRT在量表开发中的使用的很好综述:十个Holt等人(心理测试和评估模型(2010)对因素分析与项目反应理论应用的综述)。 52(3):272-297)。
在支持上述所有内容的同时,我建议您执行以下操作(以足够的顺序进行)
首先,您应该使用R,否则请启动。以下建议基于R的使用。
我假设此时您已经计算了描述性统计数据等。如果没有,心理包有一个describe()函数,该函数应该为您提供所需的统计信息。
从CRAN安装psych软件包。加载心理包。在数据上使用fa.parallel例程。这应该给您保留许多因素。然后,使用VSS(例程)。这将计算MAP标准,从而为您提供不同数量(通常)的要保留的因子。对每种数量的因子使用一种因子分析形式(不是主要成分),并进行倾斜旋转。如果倾斜旋转后您的因子似乎不相关,请切换为正交旋转。这是因为可以从倾斜旋转确定正交结构,但反之则不能。
提取MAP准则和并行分析准则之间的所有因子解。确定其中哪一个具有最合适的索引并最有意义。这是您应该保留的那个。
在IRT中,同时使用ltm和eRm,我建议从eRm开始。它为您的模型提供了更好的图形功能,并且对多模型的支持更大。话虽如此,它仅适合Rasch模型,而心理调查问卷中的数据通常无法满足其要求。祝好运!心理计量学很有趣,您无疑会发现。
验证调查表意味着证明它可以衡量应衡量的内容。因此,我想说,这主要不是一个统计问题,如果不知道您的问卷的具体内容就无法回答。Cronbach alpha与有效性无关,而是与内部一致性有关,内部一致性在某种程度上与可靠性有关(或者可以假设您的问题是可互换的,这就是可靠性,但事实并非如此)。
那么,您可以做什么来验证您的问卷?您可以研究哪些心理过程导致了特定的结果模式(例如,通过尝试通过实验操作或使用思考方式程序[“协议分析”,爱立信与西蒙,1992年)来诱导这种模式)。或比较应该有不同分数的一些对比组(例如,有对照的患者)。或将其与应该与您正在测量的特征相关联的外部标准相关联。或通过Psychoscope(TM)测量特征,并将其用作标准。
其他答案在指出您可能可以实际执行的操作时更有用-即使严格地讲,其中大多数与有效性无关(例如Chi提到“已知组有效性”和外部有效性)。
另请参阅Markus&Borsboom(2013),以现代方式了解有效性(此内容和其他有用的参考文献@ Borsboom的主页)。