序数自变量的问题在于,根据定义,由于其级别之间的真实度量间隔是未知的,因此除伞形“单调”之外,不能假定任何适当的类型关系。例如,我们必须对此做些事情-“筛选或组合变体”或“更喜欢使某物最大化的东西”。
如果您坚持将IV级的Likert等级视为序数(而不是区间或标称),那么我有两种选择。
- 使用多项式对比,即模型中使用的每个此类预测变量不仅线性输入,而且平方和三次输入。因此,不仅可以捕获线性效果,而且可以捕获更一般的单调效果(线性效果对应于保持为标度/间隔的预测变量,而其他两个效果则将其视为具有不相等的间隔)。此外,还可以输入每个预测变量的虚拟变量,这将测试名义/阶乘效应。最后,您知道预测变量充当因子的程度,线性协变量的数量以及非线性协变量的数量。在几乎所有回归(线性,逻辑,其他广义线性模型)中,此选项都很容易实现。它将消耗df,因此样本大小应足够大。
- 使用最佳缩放比例回归。这种方法将一个有序预测变量单调转换为一个间隔预测变量,从而最大化对预测变量的线性影响。CATREG(分类回归)是SPSS中此思想的实现。您的特定情况的一个问题是您想进行逻辑分析,而不是线性回归,但是CATREG不是基于logit模型的。我认为这个障碍相对较小,因为您的预测仅为2类(二进制):我的意思是您可能仍会使用CATREG进行最佳缩放,然后使用获得的转换尺度预测器进行最终logistic回归。
- 还应注意,在简单的一种比例或序数DV和一种序数IV的Jonckheere-Terpstra检验的简单情况下,它可能是一种合理的分析方法,而不是回归方法。
也可能有其他建议。以上三个是我立即想到您的问题时想到的。
让我建议您也访问以下主题:标称和小数或序数之间的关联;在序数和标度之间关联。尽管它们与特定回归无关,但它们可能会有所帮助。
但是,这些线程是关于回归,特别是物流:你必须进去看看:一个,2,3,4,5。