我目前正在为具有约300个变量和800个观察值的数据集构建二进制结果的预测模型。我已经在该站点上阅读了很多有关逐步回归相关问题以及为什么不使用它的知识。
我一直在阅读LASSO回归及其功能选择功能,并已成功使用“插入符号”包和“ glmnet”实现了它。
我能够提取与优化模型的系数lambda
,并alpha
从“插入符号”; 但是,我不熟悉如何解释系数。
- LASSO系数的解释方法是否与逻辑回归相同?
- 在逻辑回归中使用从LASSO中选择的特征是否合适?
编辑
系数的解释(如LASSO回归的指数系数一样)是系数保持1个单位变化时的对数赔率,同时保持所有其他系数不变。
您能否填写“以与逻辑回归相同的方式进行解释”的含义?确切地了解您想要概括的解释对我非常有用。
—
马修·德鲁里
@Matthew Drury-非常感谢您抽出宝贵的时间为我提供帮助,因为我的课程从未超过LASSO。通常,根据我在研究生课程中所学的知识,对数回归的指数系数产生了系数增加1个单位的对数赔率,而所有其他系数保持不变。
—
Michael Luu
在“插入符号”中,选择和。来自哪里?它可能是弹性网的超参数(LASSO的相对权重相对于岭惩罚)(在这种情况下,您实际上将使用弹性网而不是LASSO)?
—
理查德·哈迪
据我所知,大多数LASSO实现中都没有引入系数的显着性检验。因此,区别不在于我们虽然可以确定OLS中具有统计意义的变量,但不能对LASSO做到这一点,除非做出一个较弱的陈述,即所选择的相应变量的LASSO系数是要考虑的“重要”变量?
—
godspeed '16