为什么我的VAR模型在非平稳数据上比固定数据能更好地工作?


9

我正在使用python的statsmodels VAR库为财务时间序列数据建模,有些结果令我感到困惑。我知道VAR模型假设时间序列数据是固定的。我无意中拟合了两种不同证券的非平稳对数价格对数,并且令人惊讶的是,拟合值和样本内预测在相对微不足道的固定残差下非常准确。样本内预测的为99%,预测残差系列的标准偏差为预测值的10%左右。[R2

但是,当我改变对数价格并将该时间序列拟合到VAR模型时,拟合值和预测值相差甚远,在均值附近处于狭窄范围内。结果,残差在预测对数收益方面比拟合值做得更好,预测残差的标准偏差比拟合数据系列大15倍,而预测序列的.007值。[R2

我是否会误解VAR模型上的拟合残差与其他残差?为什么非平稳时间序列会比基于相同基础数据的平稳时间序列产生更准确的预测?我在同一个python库中使用ARMA模型进行了很好的工作,却看不到像对单个系列数据建模那样的东西。


5
有两个事实:(1)当您将一个随机游走回归到另一个随机游走并错误地假设平稳性时,即使它们是独立的过程,您几乎总是会获得具有统计学意义的高度结果。(2)如果两个变量是协整的,则可以使另一个变量回归,并且估计量的收敛速度将比通常的回归快,这就是所谓的超一致性。
马修·冈恩

非常感谢你。事实1肯定可以解释非平稳序列的结果。固定序列的结果肯定像在显示您所谓的超一致性一样,只是据我所知,这两个序列不是协整的。我对两个价格序列进行了线性回归,残差远非平稳。因此,我将不得不假设VAR模型的预测如此之差,因为两个收益序列之间的交叉自相关性不强。格兰杰测试也证实了这一点。
jpeginternet

@MatthewGunn,您的评论可能更适合作为答案。
理查德·哈迪

Answers:


9

两个事实:

  1. 当您将一个随机游走回归到另一个随机游走并且错误地假定平稳性时,即使它们是独立的过程,您的软件通常也会吐出统计上显着的结果例如,请参阅这些讲义。(Google会进行虚假的随机游走,并会出现许多链接。)怎么了?通常的OLS估计值和标准误差是基于在随机游走情况下不成立的假设。

    [R2Ť

  2. 如果将两个变量进行协整,则可以使另一个变量回归,并且估计量的收敛速度将比通常的回归快,这就是超一致性。例如。结账约翰·科克伦的时间序列的在线预订和搜索“superconsistent。”

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.