我是该页面的新手,而统计学和R则是新手。我正在为一个大学项目,目的是发现河流中的雨水和水位之间的相关性。一旦证明了相关性,我便要对其进行预测/预测。
数据 我有一组数年的数据(每隔5分钟)包含特定的河流:
- 毫米降水
- 河流流量,立方米每秒
这条河没有积雪,因此该模型仅基于降雨和时间。有时会有冻结的温度,但是我正在考虑将这些时间段从异常数据中删除,因为这种情况超出了我项目的范围。
示例 在这里,您有几个示例数据图,这些数据来自几个小时后的降雨和水位上升。
红线是河流流量。橙色是雨。您可以看到总是下雨,然后河里的水上升。在时间序列结束时会再次下雨,但稍后会影响河流流量。
相关性在那里。这是我在R中所做的,以证明在R中使用ccf的相关性:
- 互相关
- 前导变量
- 滞后
这是我的R线用于第二个示例(一个降雨期):
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
我的解释是:
- 降雨导致(首先发生),
- 有一个显着的相关性,其峰值为(我可以检查确切的数字,我知道该部分)。
- 我不知道如何找出相关性影响河流流量的时间,我认为这个名称是“保留”。我看到的是,雨后河水流失时,该图遵循第一个图的相同形状。我不能以此为依据说保留时间从持续到(我可以在返回的数据框中创建的对象中检查此值,看看水位何时恢复到该值)。是“下雨前”吗?有没有更好的方法来找到保留物?
ccf
我对吗?
关于时间序列。此时间序列没有周期性或季节性。随时可能下雨并造成影响。夏季确实会减少,但仍然会发生,这是一个常年下雨的地区。
模型和预测。
我不知道如何创建一个模型来进行预测,该预测告诉我在下雨后河流会增加多少流量。我一直在尝试一些arima
,auto arima
但是还没有很成功。我应该使用Arima
,vars
或其他不同的多变量模型?任何指向示例的链接都会有很大帮助。
请让我知道,如果您知道创建此预测的最佳方法,则应使用哪种模型。我正在考虑做其他一些事情,但是为了简单起见,将它们从解释中删除。如果需要,我可以共享一些数据。