在我的机器学习课程中,我们了解了LASSO回归如何很好地执行特征选择,因为它利用了正则化。
我的问题是:人们通常是仅使用LASSO模型进行特征选择(然后将这些特征转储到其他机器学习模型中),还是通常使用LASSO进行特征选择和实际回归?
例如,假设您想进行岭回归,但是您认为许多功能都不是很好。运行LASSO,仅提取算法未将其归零的功能,然后仅将那些功能用于将数据转储到ridge回归模型中是否明智?这样,您将获得正则化用于执行特征选择的好处,还正则化用于减少过度拟合的好处。(我知道这基本上等于弹性净回归,但是似乎您不需要在最终回归目标函数中同时拥有l_1和l_2项。)
除了回归之外,在执行分类任务(使用SVM,神经网络,随机森林等)时,这是否是明智的策略?
1
是的,将套索用于其他模型的特征选择是一个好主意。或者基于树的特征选择也可以供应给其他车型
—
karthikbharadwaj
套索仅在线性模型中执行特征选择-它不测试预测变量中的高阶交互或非线性。有关这可能很重要的示例:stats.stackexchange.com/questions/164048/…您的里程可能会有所不同。
—
Sycorax说恢复莫妮卡