我了解到,使用封装vif()
方法car
,我们可以计算模型中输入的多重共线性度。从维基百科来看,如果该vif
值大于,5
那么我们可以认为输入存在多重共线性问题。例如,我使用lm()
方法开发了线性回归模型,并vif()
给出了以下内容。正如我们所看到的,输入ub
,lb
以及tb
由多重痛苦。
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
为了避免多重共线性问题,并使模型更健壮,我ub
和之间进行了交互lb
,现在新模型的vif表如下:
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
有中没有太大区别R^2
价值和以及有在上述两种情况都在误差没有太大的差别,从一留出CV测试。
我的问题是:
如上所示,通过交互来避免多重共线性问题是否还好?
与上述vif方法结果相比,有没有更好的方法来表示多重共线性问题。
请给我您的建议。
谢谢。