我正在建立一个回归模型,我需要计算以下内容以检查相关性
- 2个多级分类变量之间的相关性
- 多级分类变量和连续变量之间的相关性
- 多级分类变量的VIF(方差膨胀因子)
我相信在上述情况下使用Pearson相关系数是错误的,因为Pearson仅适用于2个连续变量。
请回答以下问题
- 哪种相关系数最适合上述情况?
- VIF计算仅适用于连续数据,那么有什么替代方法?
- 在使用您建议的相关系数之前,需要检查哪些假设?
- 如何在SAS&R中实施它们?
4
我想说CV.SE是解决诸如此类的更多理论统计数据的理想场所。如果不是,我会说您问题的答案取决于上下文。有时是有道理的扁平化多层次为虚拟变量,其他时候,它是值得您的数据根据多项分布等进行建模
—
ffriend
您的分类变量是否排序?如果是,这会影响您要查找的相关类型。
—
nassimhddd 2014年
我的研究必须面对同样的问题。但我找不到解决此问题的正确方法。因此,如果可以的话,请给我您所找到的参考资料。
—
user89797 2015年
您是说p值与相关系数r相同吗?
—
Ayo Emma
上面用ANOVA进行分类和连续的解决方案是好的。小打cc。p值越小,两个变量之间的“拟合”越好。并非相反。
—
myudelson