一个简单的例子可以帮助我们确定基本要素。
令
ÿ= C+ γX1个+ ε
其中和是参数,是第一个乐器(或自变量)的得分,而表示无偏iid误差。让第二个乐器的分数与第一个乐器的分数通过CγX1个ε
X1个= α X2+ β。
例如,第二个乐器的分数可能在25到75之间,第一个乐器的分数可能在0到100之间,其中。的方差是乘以的方差。不过,我们可以重写X1个= 2 X2− 50X1个α2X2
Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C′+γ′X2+ε.
参数发生变化,自变量的方差也发生变化,但是模型的预测能力保持不变。
通常,和之间的关系可以是非线性的。哪个是的更好预测变量,将取决于哪个与线性关系更紧密。因此,问题不是规模问题之一(由的方差反映),而必须由工具与它们所用来预测的工具之间的关系决定。这个想法与最近关于选择回归中的自变量的问题中探讨的一个想法密切相关。X 2是Y X iX1X2YYXi
可能存在缓解因素。举例来说,如果与是离散变量,两者都同样涉及到,那么一个具有较大差异的威力(如果它足够均匀散开),允许它的值之间的区分越细,从而提供更高的精度。 例如,如果两种工具都是1-5李克特量表,则它们都与很好地相关,并且的答案都是2和3,的答案分布在1到5之间,可能更受欢迎。这个基础。X 2是Y X 1 X 2 X 2X1X2YYX1X2X2