R中的多元时间序列。如何找到滞后相关性并建立预测模型


16

我是该页面的新手,而统计学和R则是新手。我正在为一个大学项目,目的是发现河流中的雨水和水位之间的相关性。一旦证明了相关性,我便要对其进行预测/预测。

数据 我有一组数年的数据(每隔5分钟)包含特定的河流:

  • 毫米降水
  • 河流流量,立方米每秒

这条河没有积雪,因此该模型仅基于降雨和时间。有时会有冻结的温度,但是我正在考虑将这些时间段从异常数据中删除,因为这种情况超出了我项目的范围。

示例 在这里,您有几个示例数据图,这些数据来自几个小时后的降雨和水位上升。

更大的例子几天

较短的例子只有一个降雨期

红线是河流流量。橙色是雨。您可以看到总是下雨,然后河里的水上升。在时间序列结束时会再次下雨,但稍后会影响河流流量。

相关性在那里。这是我在R中所做的,以证明在R中使用ccf的相关性:

  • 互相关
  • 前导变量
  • 滞后

这是我的R线用于第二个示例(一个降雨期):

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

小示例2的CCF结果

我的解释是:

  • 降雨导致(首先发生),
  • 有一个显着的相关性,其峰值为(我可以检查确切的数字,我知道该部分)。450
  • 我不知道如何找出相关性影响河流流量的时间,我认为这个名称是“保留”。我看到的是,雨后河水流失时,该图遵循第一个图的相同形状。我不能以此为依据说保留时间从持续到(我可以在返回的数据框中创建的对象中检查此值,看看水位何时恢复到该值)。是“下雨前”吗?有没有更好的方法来找到保留物?450800ccf

我对吗?

关于时间序列。此时间序列没有周期性或季节性。随时可能下雨并造成影响。夏季确实会减少,但仍然会发生,这是一个常年下雨的地区。

模型和预测。 我不知道如何创建一个模型来进行预测,该预测告诉我在下雨后河流会增加多少流量。我一直在尝试一些arimaauto arima但是还没有很成功。我应该使用Arimavars或其他不同的多变量模型?任何指向示例的链接都会有很大帮助。

请让我知道,如果您知道创建此预测的最佳方法,则应使用哪种模型。我正在考虑做其他一些事情,但是为了简单起见,将它们从解释中删除。如果需要,我可以共享一些数据。


您正在寻找干预分析(在社会研究
Konstantinos

Answers:


3

您需要使用ACF和PACF行为来帮助您确定哪种模型更适合您的数据(例如,ACF曲线中存在缓慢衰减表示可能需要进行微分才能使序列更稳定。ACF曲线显然表明某种如果使用正确的变换(平稳序列),则波动必须较小且在蓝线以内。一旦使序列平稳,请考虑使用哪种模型是AR,MA,ARMA或ARIMA。在我的项目中,我做了以下工作来帮助模型选择:

ACF图在滞后2处显示相对较大的值(请参见图中的位置)。除此之外,它在滞后大于2时基本上变为零。这表明MA(2)模型可以拟合数据,然后通过查看PACF图,我们立即注意到几乎所有滞后的相关性均为零。这可能表明模型上没有任何AR部分(调整为您的绘图))。因此,我们的候选模型之一可能是具有参数p = 0,d = 1和q = 1 or2的ARIMA(p,d,q)。我还尝试了更高阶的MA,并考虑了在模型中包含AR部分的可能性,以便比较AIC,AICc和BIC的结果并决定最终模型。下一步,您将需要运行一些诊断测试以确保您选择了正确的模型,并且残差中没有模式(残差的ACF和PACF,Ljung-Box统计量的p值,残差的直方图以及QQ图)。希望能帮助到你!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.