使用损失函数进行线性回归模型,为什么我应该使用而不是L 2正则化?
是否可以防止过度拟合?它是确定性的(因此总是唯一的解决方案)?在特征选择上是否更好(因为产生稀疏模型)?它会分散特征之间的权重吗?
2
L2不进行变量选择,因此L1在这方面绝对更好。
—
Michael M