如何将问卷中的顺序数据转换为适当的间隔数据？

是否有任何简单的方法可以将序数级别的数据转换为间隔级别（正好相反）？可以在Excel或SPSS中执行吗？

有了数据，说：序数级别上的10个问题（例如0-5比例，其中0 =“完全不”，5 =“一直”），我想对其进行转换，以便可以将其视为适当的问题用于参数测试目的的时间间隔级别数据（正态分布，无法进行的非参数测试）。

将非常感谢您的回答！

— 吉尔
source

如何在0-5范围内获得6、7、8、9、10的值，或者我错过了什么？

— ttnphns'5

简单是什么意思？将分类变量转换为度量标准不是一件容易的事。在某些假设成立的情况下，有一些潜在变量模型（如IRT模型）允许这样做。另一种方法是最佳缩放。但是为此，我想您必须愿意用R做事，并深入研究一些高级统计信息，例如潜变量模型或非线性PCA。听起来还好吗？

— Momo 2012年

此响应将从测量的角度讨论可能的模型，在模型中，我们获得了一组观察到的（清单）相关变量或度量，这些变量或度量的共享方差被假定为度量良好识别但不能直接观察的构造（通常在反射形式下）方式），将其视为潜在变量。如果您不熟悉潜在特征测量模型，我将推荐以下两篇文章：Denny Borsbooom撰写的《心理计量学家的攻击》和Anders Skrondal和Sophia Rabe-Hesketh撰写的《潜在变量建模：调查》。在处理具有多个响应类别的项目之前，我将首先对二元指标进行一些讨论。

将有序级别数据转换为间隔标度的一种方法是使用某种项目响应模型。一个著名的例子是Rasch模型，该模型将并行测试模型的思想从经典测试理论扩展到处理二进制计分项通过一个通用的（具有logit链接）混合效果线性模型（在某些“现代”软件实现中），其中认可给定项目的概率是“项目难度”和“人的能力”的函数（假设没有一个人在潜在特征上的位置与同一对数刻度上的物品位置之间的交互作用-可以通过附加的物品判别参数来捕获，或者与个人特定特征的相互作用-这称为差异物品功能）。假定基本结构是一维的，并且Rasch模型的逻辑就是被调查者具有一定的“结构量”-让我们谈谈主体的责任（他/她的“能力”）， $\theta$ ，以及定义此构造的任何项目（它们的“难度”）。有趣的是，被访者位置和项目位置在测量尺度之间的差异。举一个具体的例子，请考虑以下问题：“除了焦虑以外，我很难集中精力做其他事情”（是/否）。与从普通人群中抽取的，没有抑郁或焦虑相关疾病的既往史的人相比，患有焦虑症的人更有可能对这个问题做出肯定的回答。 $\theta$

下面显示了一项29项项目响应曲线的图示，该曲线来自一项大规模的美国研究，旨在建立一个评估焦虑相关疾病的校准项目库^（1,2）。样本大小为；探索性因子分析证实了量表的一维性（第一特征值大大高于第二特征值（17倍），并且通过平行分析证实了第二因子轴不可靠（特征值刚好大于1），并且该量表显示出可靠性由Cronbach's alpha（，具有95％自举CI $N=766$ $\alpha=0.971$ $[0.967;0.975]$ ）。最初，为每个项目提出了五个响应类别（1 =“从不”，2 =“很少”，3 =“有时”，4 =“经常”和5 =“始终”）。在这里，我们仅考虑二进制评分的响应。

在此处输入图片说明
_{（在这里，对李克特类型项目的响应已被重新编码为二进制响应（1/2 = 0、3-5 = 1），并且我们认为每个项目在个体之间都是同等的判别力，因此项目曲线斜率之间的平行度（Rasch模型）。）}

可以看出，位于轴右侧的反映了潜在特质（焦虑）的人们被认为表达了更多这种特质，他们更有可能积极回答“我感到害怕”这样的问题（）或“我有突然的恐慌感”（恐慌），而不是左边的人（正常人群，不太可能被认为是病例）；另一方面，一般人群中的某人报告入睡困难（入睡）的可能性不大：对于处于潜伏特质中等范围的某人，例如logit为0，他/她的得分概率为3或更高大约是0.5（这是物品难度）。 $x$

对于具有排序类别的多项项目，有几种选择：局部信用模型，等级量表模型或分级响应模型，仅举几例，它们大多数用于应用研究中。前两个属于IRT模型的所谓“ Rasch族”，并且具有以下特性：（a）响应概率函数（项目/类别响应曲线）的单调性，（b）总体总分的充分性（具有潜在性）参数被认为是固定的），（c）局部独立性，意味着对项目的响应是独立的，以潜在特征为条件，以及（d）缺少差异项目功能 这意味着，以潜在特征为条件，反应独立于外部个体特定变量（例如，性别，年龄，种族，SES）。

将前面的示例扩展到有效地考虑了五个反应类别的情况下，与从普通人群中抽样的人相比，患者没有任何焦虑相关疾病的情况，就更有可能选择3到5个反应类别。与上述二分项目的建模相比，这些模型考虑了累积性（例如，回答3比2或更低的几率）或相邻类别阈值（回答3相对于2的几率），这也在Agresti的《分类法》中进行了讨论。数据分析（第12章）。前述模型之间的主要区别在于处理从一种响应类别到另一种响应类别的方式：部分信用模型不假定任何给定的阈值位置与潜伏性状上的阈值位置的平均值之间的差等于或跨项目统一，与评级量表模型相反。这些模型之间的另一个细微差别是，其中一些模型（例如无约束的分级响应或部分信用模型）允许项目之间的歧视参数不相等。有关更多详细信息，请参阅Reeve和Fayers的“ 将项目响应理论模型应用于评估问卷的项目和量表属性”，或参见Frank B. Baker 的项目响应理论的基础。

因为在前面的案例中，我们讨论了二分计分项目的响应概率曲线的解释，所以让我们看一下从分级响应模型得出的项目响应曲线，突出显示相同的目标项目：

在此处输入图片说明
_{（无限制的分级响应模型，允许在项目之间进行不平等的区分。）}

在这里，以下观察值得考虑：

“睡觉”项的回答类别比“出色”的回答类别具有更少的歧视性：在“睡觉”的情况下，对于位于潜伏区间的两个极值处的两个人特质（以对数为单位），他们选择第四种反应的概率（“ 经常有睡眠困难”）大约为。0.35至0.4；如果设置为“很棒”，则该概率从小于0.1变为大约0.25（蓝色虚线）。如果您想区分两名表现出焦虑症状的患者，则后者可以提供更多信息。 $[2;2.5]$
尽管睡眠障碍并不少见，但从左到右，评估睡眠质量的项目与评估更严重疾病的项目之间存在着整体变化。这是可以预料的：毕竟，即使是一般人群，入睡时也可能会遇到一些困难，而与他们的健康状况无关，严重抑郁或焦虑的人也可能会出现此类问题。但是，“正常人”（如果有任何含义）不太可能显示出恐慌症的迹象（对于处于中等范围或更高潜伏性状的人，他们选择最高反应类别的可能性为零，[ 0; 1]）。

在这两种情况下所讨论的，这规模反映个人责任在假定潜在特质具有的属性间隔尺度 $\theta$ 。

除了被认为是真正的度量模型之外，使Rasch模型具有吸引力的是，总和得分作为足够的统计量，可以用作潜在得分的替代指标。此外，充分性属性很容易暗示模型（人员和物品）参数的可分离性（在多件物品的情况下，不应忘记，所有物品都适用于物品响应类别），因此具有可加性。

Mair和Hatzinger在《统计软件杂志》上发表的文章中对IRT模型层次结构以及R进行了很好的回顾：扩展Rasch建模：R中IRT模型应用的eRm软件包。其他模型包括对数线性模型，非参数模型（例如Mokken模型）或图形模型。

除R外，我不知道Excel的实现，但是在此线程上提出了一些统计软件包：如何开始使用项目响应理论以及使用什么软件？

最后，如果您想研究项目集和响应变量之间的关系而无需借助测量模型，那么通过最佳缩放比例进行某种形式的变量量化也可能会很有趣。除了那些线程中讨论的R实现之外，还在相关线程上提出了SPSS解决方案。

参考文献

皮尔科尼斯（Pilkonis），崔（Choi），瑞瑟（Reise），斯托弗（A.Stover）和赖利（W. （2011）。项目库用于从患者报告的结果测量信息系统（PROMIS）中测量情绪困扰：抑郁，焦虑和愤怒。评估，18（3），263–283。
Choi，S.，Gibbons，L.和Crane，P.（2011）。lordif：R包，用于使用迭代混合序数逻辑回归/项目响应理论和蒙特卡洛模拟来检测差异项目功能。统计软件杂志，39（8）。

— hl
source

@Momo谢谢。很好奇在回答（并今天重新编辑此回复）时，我没有注意到您的评论值得+1。请随意编辑我认为合适的回复。

— chl 2012年

艾伦·阿格里斯蒂（Alan Agresti）在他的《有序分类数据分析》一书中介绍了几种方法。其中之一是ridits，我在博客中讨论了

— 彼得·弗洛姆-恢复莫妮卡
source

您能再解释一下吗？乍一看，似乎任何声称将序数数据客观地转换为间隔数据的方法都是神奇的，因为您似乎总是可以给出不太病理的反例，从而“破坏”任何方法，但我可能会遗漏重要的事情。似乎还需要对序数类别之间的距离有一些先验的概念-这是从哪里来的？

— 2012年

这些公式在博客文章中，而完整的讨论在Agresti的书中，但从本质上讲，它使用数据创建“平均累积比例”，然后将其用作得分。距离来自每个响应中的比例，而不是类别本身中的任何东西。

— 彼得·弗洛姆

+1。Ridit很容易解释为分数减去+（1/2）分数等于。因此，如果1、2、3、4、5的观察分数或概率为0.2、0.4、0.2、0.1、0.1，则1的倍数为0.1；2的值等于0.4，以此类推。Ridits对称地对待类别，结果比0少或多于1的可能性较小，因此通常包含0或1。

— 尼克·考克斯

这个名字参照单位本身就是滑稽意在通过布罗斯（注：参考需要），并假定的解释是胡言乱语。更好的名字是中间分布函数（Parzen 1993）和等级函数Haberman（1996）。Haberman，SJ1996。《 高级统计资料第一卷：人口描述》。纽约：施普林格。Parzen，E.1993。更改PP图和连续样本分位数功能。统计学通讯-理论与方法 22：3287-3304。

— 尼克·考克斯

可以通过例如正常或高斯分位数函数来推动Ridits本身。

— 尼克·考克斯