拉索回归的时间复杂度是多少?


Answers:


4

回想一下套索是具有l1正则化的线性模型。

查找参数可以公式化为无约束优化问题,其中参数由

argminβ||yXβ||2+α||β||1

在约束形式中,参数由下式给出

argminβ||yXβ||2s.t.||β||1<α

这是二次规划问题,因此是多项式。

几乎所有凸优化例程,甚至对于诸如神经网络之类的灵活非线性事物,都依赖于计算目标wrt参数的导数。您不能取的导数。| w | | 1。因此,您依赖于不同的技术。查找参数的方法有很多。这是一篇有关该主题的评论文章,即采用L1-范数正则化的最小二乘优化。迭代凸优化的时间复杂度很难分析,因为它取决于收敛准则。通常,随着观察值的增加,迭代问题收敛于更少的时期。α||w||1


4
几件事:说一个问题是“多项式”并不是特别有帮助,除非您正在研究某种组合问题(通常是指数问题)。其次,计算导数几乎始终不是限制步骤。第三,通常讨论的迭代算法的时间复杂度的情况下,一个通常着眼于成本每步,因此不会依赖于收敛准则。最后,更多的观察=更少的迭代并不是通常的情况。
Cliff AB

13

虽然@JacobMick提供了更广泛的概述以及指向评论文章的链接,但让我给出“捷径答案”(可以将其视为特例)。

KnO(K3+K2n)

  • K<nK3<K2nO(K2n)K
  • ķ 3ķ 2 Ñ øķ 3KnK3K2nO(K3)

参考文献:


理查德,您可以在stats.stackexchange.com/questions/280304/…上评论GLM方法的迭代复杂度吗?
rnoodle '17

@moodle,我不能不深入探讨(目前我没有时间),但是对您的问题+1。
理查德·哈迪

我看了一下,但不清楚-再看一眼会很好。因此,存在迭代复杂性和完全收敛性复杂性,我认为文献有时对定义有些含糊。基本上,我有一种在非常关键的位置使用套索求解器的算法,因此我算法的复杂度在很大程度上取决于求解器。钉上钉子会很好。干杯! 我会赏金给您输入
rnoodle '17

@rnoodle,我非常怀疑我能尽快在那儿为您提供帮助,但赏金肯定会吸引其他了解更多的人。祝好运!
理查德·哈迪
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.