尽管仍然缺少一些信息(每个次级量表的人数和物品数量),但这里还是一些有关减小规模的一般提示。另外,由于您是在调查问卷级别上工作,所以我不明白为什么它的长度如此重要(毕竟,您只会提供汇总统计信息,例如总分或均值)。
我将假设(a)您有一组K项,它们测量与士气有关的某些构造,(b)您的“一维”量表是一个二阶因子,可以细分为不同的方面,(c)您想将您的量表减少到k <K个项目,以便在保持量表内容有效性的同时,以足够的准确性汇总受试者的总量表分数。
关于此经过验证的量表的内容/结构有效性:当然已经选择了项目数,以最好地反映出所关注的结构。通过缩短调查问卷,您实际上正在减少构建的覆盖范围。仅考虑一半项目时,最好检查因子结构是否保持不变(毕竟,这也可能影响选择它们的方式)。这可以使用传统的FA技术来完成。您有责任以类似于作者的精神来解释量表。
关于分数可靠性:尽管这是一种与样本有关的度量,但是当减少项目数时,分数可靠性会下降(请参阅Spearman-Brown公式)。另一种观察方法是标准测量误差(SEM)会增加,但是请参见Leo M Harvill 撰写的NCME标准测量误差指导模块。不用说,它适用于取决于项目数量的每个指标(例如,可用于估计一种形式的可靠性即内部一致性的Cronbach's alpha)。希望这不会影响任何基于原始分数的组间比较。
因此,我的建议(最简单的方法)是:
- 选择您的项目,以最大程度地扩大构造范围;用FA检查维度,并使用单变量响应分布检查覆盖范围;
- 将平均项目间相关性与先前报告的相关性进行比较;
- 计算完整比例和您的复合材料的内部一致性;检查它们是否与原始规模的已发布统计数据相符(无需进行任何测试,这些都是依赖于样本的度量);
- 测试原始分数和简化分数(子分数)之间的线性(或多变量或等级)相关性,以确保它们具有可比性(即,通过原始分数可以看出,潜伏性状上的个体位置没有很大变化) );
- 如果您有特定于主题的外部变量(例如,性别,年龄或最好的与士气有关的量度),请比较两种形式之间的已知群体效度。
困难的方法是依靠项目响应理论来选择那些携带有关潜在特征的信息最多的项目-缩减规模实际上是其最佳应用之一。多线程项目的模型在此线程中进行了部分描述,即“ 验证问卷”。
第二次更新后更新
- 无需再为主题如此之少的多模项目准备任何IRT模型。
- 因子分析也将遭受如此低的样本量的困扰。您将获得不可靠的因子负荷估算值。
- 30项除以2 = 15项(很容易就知道总分的相应SEM有所提高),但是如果考虑子量表的话,那肯定会变得更糟(这实际上是我的第二个问题-否。每个分量表)