套用滞后的顺序?


9

假设我有形式的纵向数据(我有多个观察结果,这只是一个形式)。我对限制感兴趣。不受限制的等效于 与。Y=(Y1,,YJ)N(μ,Σ)ΣΣ

Yj=αj+=1j1ϕjYj+εj
εjN(0,σj)

通常不这样做,因为它需要估计协方差参数。如果我们采用则模型为“ ” 即我们仅使用前面的项可以根据历史预测。O(J2)k

Yj=αj+=1kϕjYj+εj,
kYj

我真正想做的是使用某种收缩方法将某些清零,例如LASSO。但事实是,我也想用我喜欢的模型,其是lag-方法一些 ; 我想对高阶滞后的惩罚要比低阶滞后的惩罚更多。考虑到预测变量高度相关,我认为这是我们特别想做的事情。ϕjkk

另一个问题是,如果(说)缩小为我也希望缩小为,即在所有条件分布中使用相同的滞后。ϕ350ϕ360

我可以对此进行推测,但是我不想重新发明轮子。是否有旨在解决此类问题的LASSO技术?我是否最好只做其他事情,例如逐步添加滞后单?由于我的模型空间很小,我什至可以对这个问题使用惩罚?L0

Answers:


2

您可以从k = 0到最大值,反复进行交叉验证,然后针对k绘制性能。由于正在对模型进行从未见过的数据测试,因此无法保证复杂模型的性能会更好,并且如果由于过度拟合而使模型变得过于复杂,确实会导致性能下降。我个人认为,这比拥有任意罚款因子更安全,更容易辩护,但您的行驶里程可能会有所不同。

我也不太了解套索如何回答这个问题。似乎过于严格,它完全强制了系数的排序。而原始问题可能会针对某些具有解决方案的数据而结束,其中并非严格随l减小。ϕlj


要将LaTeX添加到您的问题中,请将表达式括在美元符号($)之间。
Patrick Coulombe 2014年

1
(1)仅从模型来看,系数排序不是理想的,但从本质上讲是合理的。例如,在重复测量的临床试验中,没有实质性的理由期望的小扰动对随机影响大于的小扰动。所订购的LASSO可以更好地利用此先验知识,但冒着可能不正确的较小风险。Yj2YjYj1
2014年

(2)通常,我不会至少部分使用这种简历策略,因为它太教条了。通过明智地缩小延迟,而不是完全消除延迟,我可以获得更好的预测。
2014年

尼尔,对订购的LASSO的有用评论。我已经对答案进行了更全面的编辑。谢谢!
肖恩·复活节

谢谢肖恩。伙计,我认为这不是太教条。您不是在千篇一律,而是允许它有所不同。它选择的k将在过拟合的开始。我也非常不同意您关于先验知识的陈述。看起来合理并且知道那件事完全不同的东西。我必须承认,传统统计数据似乎难以抵制我从未理解的交叉验证。我会选择每天从样本数据中选择预测效率,而不是添加假设。
尼尔·弗里德曼

2

命令LASSO似乎是你在找什么:它计算规则化回归系数在标准套索,但受制于附加约束。β1...j|β1||β2|...|βj|

这样就实现了第二个目标,即对高阶滞后的系数归零,但是比偏爱较低滞后模型的唯一限制更具限制性。正如其他人所指出的那样,这是一个严格的限制,可能很难证明其合理性。

在消除了警告之后,本文在真实和模拟时间序列数据上都给出了该方法的结果,并详细介绍了找到系数的算法。结论中提到了R软件包,但该论文是最近的,并且在CRAN上搜索“有序LASSO”是空的,因此我怀疑该软件包仍在开发中。

本文还提供了一种通用方法,其中使用两个正则化参数“鼓励接近单调性”。(请参阅第6页。)换句话说,人们应该能够调整参数以实现轻松的排序。可悲的是,既没有提供示例也没有提供宽松方法的比较。但是,作者写道,实现这一更改是用一种算法替换另一种算法的简单问题,因此有人希望它将成为即将到来的R包的一部分。


谢谢,这是一个新想法真有趣。当我9个月前问这个问题时,我实际上想到了与一个朋友讨论该问题的相同想法,但从未深入研究!我只是以为这个想法不是那么新颖,或者别人已经写过一篇关于它的论文。
2014年

非常欢迎!我很惊讶自己这么近。
肖恩·复活节

1

可以使用嵌套的LASSO罚分(pdf),但没有R软件包。


1
目前,这更多是评论而不是答案。您可以通过讨论嵌套的LASSO罚款等将其扩大一点吗?
gung-恢复莫妮卡

0

我知道您将它作为前提编写,但是在绝对不确定这是必需的情况下,我不会使用有序LASSO,因为有序LASSO的假设并不直接适合于时间序列预测。作为反例,请考虑在测量和目标之间有十个时间步长的延迟时间的情况。显然,如果不将废话归因于前9个参数,则有序LASSO约束将无法处理此类影响。

相比之下,我宁愿坚持正常的套索,包括所有以前的观察-尤其是因为你写你的模型空间小,并协调血统套索优化程序(如描述这里)是有效的也工作了大型数据集。然后计算正则化强度参数的路径,并查看从大到包含哪些参数。特别是那些较早的是重要的。λλλ=0

最后,您必须选择适当的标准,并使用交叉验证,标准一维最小化或其他方法来优化参数。该标准例如可以是“预测误差+包含变量的数量”(类似于AIC标准)。λ


如果我没有很强的先验理由相信这一点,那么我显然对约束系数的顺序不感兴趣。对于我怀疑可能的模型,启发式订购LASSO应该更有效。在我的实际环境中,滞后系数为10且其他9为0毫无意义。这是我的同事研究的一个问题(基于滞后的有序收缩),但是他们使用了贝叶斯(Bayesuan)思想,因此不会考虑使用(非贝叶斯)LASSO。
2014年

好的,您似乎知道自己在做什么。但是请记住,有序LASSO比您的“一次零-始终为零”语句受到的约束更大。另外,您也可以考虑一个模型,其中参数以乘法方式输入。然后,相对重要性可以增大或减小直到系数变为零。
davidhigh 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.