与数据标准化相关的混乱


9

我正在尝试学习线性回归模型。但是,我对数据的规范化有些困惑。我已经将特征/预测值标准化为零均值和单位方差。我是否需要对目标执行相同的操作。如果可以,为什么?


1
为什么要对功能/预测变量进行归一化?
Peter Flom

4
顺便说一句,我认为“标准化”是一个更好的说法。
Scortchi-恢复莫妮卡

Answers:


6

线性回归中的目标标准化无所谓。在线性回归中,您的拟合将为

ÿ^一世=一个0+一个X一世
当你预测 X一世 居中,常数项 一个0 将永远是 ÿ一世。因此,如果您居中ÿ一世 在进行回归之前,您将获得 一个0=0,但所有其他系数将保持不变。

(话虽如此,规范化预测变量(如您目前正在执行的操作)是一个好主意。)


1
为什么将预测变量标准化是个好主意?
Scortchi-恢复莫妮卡

@Stefan。是的,当我集中预测变量时,我得到了常数项一个0是y的平均值。但是我不明白它是怎么变成卑鄙的。你能告诉我它背后的数学吗?
user34790

2
@Scortchi不必对预测变量进行归一化,但是可以使从回归中解释系数更加容易:归一化之后,大系数对应于重要的预测变量。同样,如果不进行归一化,则交互项的系数可能会严重误导。话虽如此,归一化不会影响您从模型中获得的预测,因此归一化仅在您打算解释回归系数时才重要。
Stefan Wager

1
@ user34790该数学公式位于pmean.com/10/LeastSquares.html
Stefan Wager

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.