大家好,我发现了一两篇使用山脊回归的论文(用于篮球数据)。如果运行ridge回归,总是被告知要标准化我的变量,但是却被告知要这样做,因为ridge是比例变量(ridge回归并不是我们课程的真正组成部分,因此我们的讲师会略过它)。
我读过的这些论文并未对它们的变量进行标准化,这让我感到有些惊讶。他们还通过交叉验证最终获得了很大的lambda值(大约在2000-4000水平),并且我被告知这是由于未对变量进行标准化。
不标准化变量到底会如何导致较高的lambda值,并且,一般而言,不标准化变量会有什么后果?真的有什么大不了的吗?
任何帮助深表感谢。