目前,我正在一个项目中进行时间序列数据(每月数据)的预测。我正在使用R进行预测。我有1个因变量(y)和3个独立变量(x1,x2,x3)。y变量具有73个观测值,其他3个变量也具有观测值(alos 73)。从2009年1月到2015年1月。我检查了相关性和p值,将其放入模型中非常重要。我的问题是:如何使用所有自变量进行良好的预测?我没有这些变量的将来值。假设我想预测两年(2017年)后我的y变量。我怎样才能做到这一点?
我尝试了以下代码:
model = arima(y, order(0,2,0), xreg = externaldata)
我可以使用此代码对两年内的y值进行预测吗?
我还尝试了回归代码:
reg = lm(y ~ x1 + x2 + x3)
但是如何花时间在这段代码中?我如何预测我的y值将超过2年?我是统计和预测的新手。我已经进行了一些读取并查看了滞后值,但是如何在模型中使用滞后值进行预测呢?
实际上,我的总体问题是,如何使用没有未来价值的外部变量来预测时间序列数据?