我正在尝试创建一个简化的模型来预测许多高度相关的因变量(DV)(〜450)。
我的自变量(IV)也很多(〜2000)并且高度相关。
如果我使用套索分别为每个输出选择一个简化的模型,那么当我遍历每个因变量时,不能保证获得相同的独立变量子集。
是否有在R中使用套索的多元线性回归?
这不是组套索。套索组IV。我想要多元线性回归(意味着DV是矩阵,而不是标量的向量),它也实现套索。(注意:正如NRH所指出的,这是不正确的。组套索是一个通用术语,它包括对IV进行分组的策略,但也包括对其他参数(如DV)进行分组的策略)
我发现本文进入了所谓的稀疏重叠集套索
这是一些进行多元线性回归的代码
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
这是在单个DV上执行套索的一些代码
> fit = glmnet(dictionary, target[,1])
这就是我想做的:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
一次选择适合所有目标的特征
glmnet
,它有一个完整的小插图。