拥有面板数据时,您可以尝试解决其他任务,例如时间序列分类/回归或面板预测。对于每个任务,都有许多解决方法。
当您想使用机器学习方法来解决面板预测时,有多种方法:
关于输入数据(X),将单位(例如国家,个人等)作为iid样本,您可以
- 将时间序列进行分箱并将每个分箱视为一个单独的列,忽略任何时间顺序,所有单元的分箱均相等,则分箱大小当然可以只是观察到的时间序列度量,或者您可以上采样并聚合为更大的分箱,然后使用标准的机器学习算法来处理表格数据,
- 或从每个单位的时间序列中提取特征,然后将每个提取的特征用作单独的列,再结合标准表格算法,
- 或根据观察的是连续时间还是分类时间数据,使用专门的时间序列回归/分类算法,这包括带有特殊内核的支持向量机,这些内核将时间序列与时间序列进行比较。
关于输出数据(y),如果您希望将来预测多个时间点,则可以
- 始终使用相同的输入数据,为要预测的每一步拟合一个估算器,
- 或在第一步中使用单个估计器进行预测,然后在预测中及时滚动输入数据,使用第一步预测将其追加到观察到的输入数据上,以进行第二步预测,依此类推。
以上所有方法基本上将面板预测问题简化为时间序列回归或表格回归问题。数据采用时间序列或表格回归格式后,您还可以为用户添加任何时不变特征。
当然,还有其他选项可以解决面板预测问题,例如使用经典的预测方法(例如适用于面板数据的ARIMA)或深度学习方法,这些方法可让您直接进行序列到序列的预测。