是否有任何简单的方法可以将序数级别的数据转换为间隔级别(正好相反)?可以在Excel或SPSS中执行吗?
有了数据,说:序数级别上的10个问题(例如0-5比例,其中0 =“完全不”,5 =“一直”),我想对其进行转换,以便可以将其视为适当的问题用于参数测试目的的时间间隔级别数据(正态分布,无法进行的非参数测试)。
将非常感谢您的回答!
是否有任何简单的方法可以将序数级别的数据转换为间隔级别(正好相反)?可以在Excel或SPSS中执行吗?
有了数据,说:序数级别上的10个问题(例如0-5比例,其中0 =“完全不”,5 =“一直”),我想对其进行转换,以便可以将其视为适当的问题用于参数测试目的的时间间隔级别数据(正态分布,无法进行的非参数测试)。
将非常感谢您的回答!
Answers:
此响应将从测量的角度讨论可能的模型,在模型中,我们获得了一组观察到的(清单)相关变量或度量,这些变量或度量的共享方差被假定为度量良好识别但不能直接观察的构造(通常在反射形式下)方式),将其视为潜在变量。如果您不熟悉潜在特征测量模型,我将推荐以下两篇文章:Denny Borsbooom撰写的《心理计量学家的攻击》和Anders Skrondal和Sophia Rabe-Hesketh撰写的《潜在变量建模:调查》。在处理具有多个响应类别的项目之前,我将首先对二元指标进行一些讨论。
将有序级别数据转换为间隔标度的一种方法是使用某种项目响应模型。一个著名的例子是Rasch模型,该模型将并行测试模型的思想从经典测试理论扩展到处理二进制计分项通过一个通用的(具有logit链接)混合效果线性模型(在某些“现代”软件实现中),其中认可给定项目的概率是“项目难度”和“人的能力”的函数(假设没有一个人在潜在特征上的位置与同一对数刻度上的物品位置之间的交互作用-可以通过附加的物品判别参数来捕获,或者与个人特定特征的相互作用-这称为差异物品功能)。假定基本结构是一维的,并且Rasch模型的逻辑就是被调查者具有一定的“结构量”-让我们谈谈主体的责任(他/她的“能力”),θ,以及定义此构造的任何项目(它们的“难度”)。有趣的是,被访者位置和项目位置在测量尺度之间的差异。举一个具体的例子,请考虑以下问题:“除了焦虑以外,我很难集中精力做其他事情”(是/否)。与从普通人群中抽取的,没有抑郁或焦虑相关疾病的既往史的人相比,患有焦虑症的人更有可能对这个问题做出肯定的回答。
下面显示了一项29项项目响应曲线的图示,该曲线来自一项大规模的美国研究,旨在建立一个评估焦虑相关疾病的校准项目库(1,2)。样本大小为;探索性因子分析证实了量表的一维性(第一特征值大大高于第二特征值(17倍),并且通过平行分析证实了第二因子轴不可靠(特征值刚好大于1),并且该量表显示出可靠性由Cronbach's alpha(,具有95%自举CIα = 0.971 [ 0.967 ; 0.975 ])。最初,为每个项目提出了五个响应类别(1 =“从不”,2 =“很少”,3 =“有时”,4 =“经常”和5 =“始终”)。在这里,我们仅考虑二进制评分的响应。
(在这里,对李克特类型项目的响应已被重新编码为二进制响应(1/2 = 0、3-5 = 1),并且我们认为每个项目在个体之间都是同等的判别力,因此项目曲线斜率之间的平行度(Rasch模型)。)
可以看出,位于轴右侧的反映了潜在特质(焦虑)的人们被认为表达了更多这种特质,他们更有可能积极回答“我感到害怕”这样的问题( )或“我有突然的恐慌感”(恐慌),而不是左边的人(正常人群,不太可能被认为是病例);另一方面,一般人群中的某人报告入睡困难(入睡)的可能性不大:对于处于潜伏特质中等范围的某人,例如logit为0,他/她的得分概率为3或更高大约是0.5(这是物品难度)。
对于具有排序类别的多项项目,有几种选择:局部信用模型,等级量表模型或分级响应模型,仅举几例,它们大多数用于应用研究中。前两个属于IRT模型的所谓“ Rasch族”,并且具有以下特性:(a)响应概率函数(项目/类别响应曲线)的单调性,(b)总体总分的充分性(具有潜在性)参数被认为是固定的),(c)局部独立性,意味着对项目的响应是独立的,以潜在特征为条件,以及(d)缺少差异项目功能 这意味着,以潜在特征为条件,反应独立于外部个体特定变量(例如,性别,年龄,种族,SES)。
将前面的示例扩展到有效地考虑了五个反应类别的情况下,与从普通人群中抽样的人相比,患者没有任何焦虑相关疾病的情况,就更有可能选择3到5个反应类别。与上述二分项目的建模相比,这些模型考虑了累积性(例如,回答3比2或更低的几率)或相邻类别阈值(回答3相对于2的几率),这也在Agresti的《分类法》中进行了讨论。数据分析(第12章)。前述模型之间的主要区别在于处理从一种响应类别到另一种响应类别的方式:部分信用模型不假定任何给定的阈值位置与潜伏性状上的阈值位置的平均值之间的差等于或跨项目统一,与评级量表模型相反。这些模型之间的另一个细微差别是,其中一些模型(例如无约束的分级响应或部分信用模型)允许项目之间的歧视参数不相等。有关更多详细信息,请参阅Reeve和Fayers的“ 将项目响应理论模型应用于评估问卷的项目和量表属性”,或参见Frank B. Baker 的项目响应理论的基础。
因为在前面的案例中,我们讨论了二分计分项目的响应概率曲线的解释,所以让我们看一下从分级响应模型得出的项目响应曲线,突出显示相同的目标项目:
(无限制的分级响应模型,允许在项目之间进行不平等的区分。)
在这里,以下观察值得考虑:
在这两种情况下所讨论的,这规模反映个人责任在假定潜在特质具有的属性间隔尺度。
除了被认为是真正的度量模型之外,使Rasch模型具有吸引力的是,总和得分作为足够的统计量,可以用作潜在得分的替代指标。此外,充分性属性很容易暗示模型(人员和物品)参数的可分离性(在多件物品的情况下,不应忘记,所有物品都适用于物品响应类别),因此具有可加性。
Mair和Hatzinger在《统计软件杂志》上发表的文章中对IRT模型层次结构以及R进行了很好的回顾:扩展Rasch建模:R中IRT模型应用的eRm软件包。其他模型包括对数线性模型,非参数模型(例如Mokken模型)或图形模型。
除R外,我不知道Excel的实现,但是在此线程上提出了一些统计软件包:如何开始使用项目响应理论以及使用什么软件?
最后,如果您想研究项目集和响应变量之间的关系而无需借助测量模型,那么通过最佳缩放比例进行某种形式的变量量化也可能会很有趣。除了那些线程中讨论的R实现之外,还在相关线程上提出了SPSS解决方案。