在具有高度相关的回归变量的多元线性回归中,最佳方法是使用什么?添加所有相关回归变量的乘积是否合法?
在具有高度相关的回归变量的多元线性回归中,最佳方法是使用什么?添加所有相关回归变量的乘积是否合法?
Answers:
从数学上讲,主要成分具有很大的意义。但是,在这种情况下,我只是使用一些数学技巧,并希望不需要考虑自己的问题,因此会有所警惕。
我建议您考虑一下我拥有什么样的预测变量,自变量是什么,为什么我的预测变量相互关联,我的一些预测变量是否实际上在测量相同的基础现实(如果可以,我是否可以使用一个单一度量以及我的预测变量中哪一个最适合),我正在做的分析是-如果我对推断不感兴趣,仅对预测感兴趣,那么只要将来,我实际上就可以保持现状预测值类似于过去的值。
这是斯蒂芬回答的另一个启发:
如果您的某些相关回归变量之间存在有意义的关联(例如,它们是智力的不同度量,即口头,数学等),则可以使用以下一种技术创建一个用于测量同一变量的单个变量:
对回归变量求和(如果回归变量是整体的组成部分则比较合适,例如,语言智商+数学智商=总体智商)
回归变量的平均值(如果回归变量正在测量相同的基础结构,例如左鞋的尺寸,右鞋的尺寸以测量脚的长度,则合适)
因子分析(以解决测量中的错误并提取潜在因子)
然后,您可以删除所有相关的回归变量,并将其替换为以上分析得出的一个变量。
我要说的和上面的斯蒂芬·科拉萨(Stephan Kolassa)差不多(所以赞成他的回答)。我只补充说,有时多重共线性可能是由于使用了广泛的变量,而这些变量都与某种规模的度量高度相关,并且可以通过使用密集变量(即将所有事物除以某种规模的度量)来改善情况。例如,如果您的单位是国家/地区,则可以根据具体情况按人口,地区或GNP进行划分。
哦-回答原始问题的第二部分:添加所有相关回归变量的乘积将是一个好主意,我想不出任何情况。有什么帮助?什么意思
我不是专家,但是我的第一个想法是对预测变量进行主成分分析,然后使用生成的主成分预测因变量。
这不是补救措施,但绝对是朝正确方向迈出的一步。