惩罚模型可用于估计参数数量等于或大于样本大小的模型。在大型稀疏分类或计数数据表的对数线性模型中可能会出现这种情况。在这些情况下,通常还希望通过组合某个因子的级别来折叠表格,而这些因子的级别在它们与其他因子的交互方式方面是无法区分的。两个问题:
- 有没有办法使用诸如LASSO或弹性网之类的惩罚模型来测试每个因素中各个级别的可折叠性?
- 如果第一个问题的答案是肯定的,那么是否可以而且应该以这样的方式进行设置:水平崩溃和模型系数的估计可以一步完成?
1
本文doi.org/10.1177/1471082X16642560很好地概述了过去十年左右在这一领域所做的工作。
—
乔恩·比克勒
注意:下面讨论的代价是@JorneBiccler链接中的公式3.4。(很有趣的是,之前已经考虑过这个问题!)
—
user795305 2007年
我们如何将其称为之前问题的重复项?
—
Michael R. Chernick's