我正在开发问卷。为了提高其可靠性和有效性,我想使用统计方法。
我想消除答案始终相同的问题。这意味着几乎所有参与者都对这些问题给出了相同的答案。
现在我的问题是:
- 这类无用的问题的答案总是相同的,与使用环境无关的技术术语是什么?
- 有什么方法可以识别此类问题?
我正在开发问卷。为了提高其可靠性和有效性,我想使用统计方法。
我想消除答案始终相同的问题。这意味着几乎所有参与者都对这些问题给出了相同的答案。
现在我的问题是:
Answers:
经典测试理论(CTT)和项目响应理论(IRT)都可以提供指导,说明哪些项目对您希望测量的潜在特征有帮助,哪些没有。使用CTT时,请考虑1)项目难度,2)项目与总分的相关性,3)项目差异以及4)如果删除项目,则对内部一致性估计值(例如Cronbach's alpha)的影响。
太容易或太困难的项目往往无助于区分主题(区分高分者和低分者)。除非您有兴趣衡量最佳表现者之间的差异,否则应考虑删除非常困难的问题。同样,非常简单的项目仅在您对表现欠佳的人员感兴趣时才适用。
所有项目均应与总得分呈正相关,您可以将相关性的下限设置为0.20左右作为指导。低相关性或负相关性可能表示您的问卷中存在措词问题,并且该问题应打分。
具有低方差(分数可变性)的项目应考虑删除,因为它们不会分隔主题,也不会有助于从调查中收集信息。差异很大的项目可能正在测量您想要测量的结构/特征以外的东西。
如果内部一致性的估计随着项目的删除而提高,则应考虑将项目删除或重新措词。
每个人都正确的项目有时是最大项目,每个人都出错的项目有时被称为最小项目。它们不会有助于您尝试收集的信息。
如果您正在开发高风险问卷或计划对问卷进行营销,则绝对应该考虑使用IRT。但是,这是一个很大的主题领域,除非您真正感兴趣,否则可能不值得在这里进行讨论。
希望这可以帮助。
我相信您正在寻找的是项目响应理论。您提到的“无用”问题是歧视性较弱的项目。使用IRT分析,您可以计算出被调查者对项目的辨别力,难度和相关的猜测概率。R程序有一个使用IRT的简单软件包,我想其他统计软件包也可以。
如果您想快速浏览一下,请访问Wikipedia页面,但我建议您进行更多研究。 http://en.wikipedia.org/wiki/Item_response_theory