在处理许多输入变量时,我们经常担心多重共线性。有多种多重共线性度量用于检测,考虑和/或传达多重共线性。一些常见的建议是:
- 特定变量 的倍数
- 特定变量 的公差
- 特定变量 的方差膨胀因子
整个设计矩阵的条件号:
(在Wikipedia文章中讨论了其他一些选项,在R的上下文中也有关于SO的讨论。)
前三个相互之间是完美的功能,这表明它们之间唯一可能的净利益是心理上的。另一方面,前三个允许您单独检查变量,这可能是一个优点,但是我听说条件编号方法被认为是最好的。
- 这是真的?最适合什么?
- 条件数是的理想函数吗?(我想会的。)
- 人们是否发现其中之一最容易解释?(我从来没有尝试过在课外解释这些数字,我只是对多重共线性给出了一个宽松的,定性的描述。)
:我已经发布了相关的跟进问题,并回答是补充的是已经在这里stats.stackexchange.com/questions/173665/...
—
凯里尼亚