一个规范是唯一的(至少部分),因为是在间非凸和凸的边界。一个范数是“最稀疏”凸模(右?)。 p = 1 L 1
我了解欧几里得范数源于几何,当维数具有相同单位时,它具有清晰的解释。但是我不明白为什么它优先于其他实数:?吗?为什么不将整个连续范围用作超参数?p > 1 p = 1.5 p = π
我想念什么?
一个规范是唯一的(至少部分),因为是在间非凸和凸的边界。一个范数是“最稀疏”凸模(右?)。 p = 1 L 1
我了解欧几里得范数源于几何,当维数具有相同单位时,它具有清晰的解释。但是我不明白为什么它优先于其他实数:?吗?为什么不将整个连续范围用作超参数?p > 1 p = 1.5 p = π
我想念什么?
Answers:
通常首选线性模型下的平方误差,因为:
ℓ 1 ℓ p 0 < p < 1通常被认为是严格稀疏性(非零项计数)的便捷代理或凸弛,后者稀疏组合,例如,对于大多数大型线性方程组来说,最小 ell_1-范数解也是最稀疏的解决方案。有些人倾向于使用,来实施更多的稀疏性,但代价是“失去”凸度。
但是,计数度量对非零缩放不敏感。将向量乘以非零常数,则非零项的数量将保持不变。因此,是阶齐次的,而范数或准范数都是 阶齐次的。即使以某种方式 如,这种差异对我来说似乎也是一个差距。ℓ 0 0 ℓ p 1 ℓ p → ℓ 0 p → 0
因此,与规范保持一致,一些组织正在考虑(非凸)规范比率,例如 ,例如,参见《出租车》中Euclid中的参考:带平滑的正则化的稀疏盲反卷积。ℓ 1 / ℓ 2