面板数据的机器学习算法


12

在这个问题中- 是否有一种考虑结构化/分层/多级预测变量的构造决策树的方法?-他们提到了树木的面板数据方法。

是否有支持矢量机和神经网络的特定面板数据方法?如果是这样,您能否引用一些有关算法和实现它的R包的文章?


1
我想知道您决定为此使用什么?试图解决类似的问题。
user0

Answers:


1

LSTM(长期短期记忆)可能与您有关。这种类型的模型可以在多个时间点处理多个功能,这些功能应适合面板数据。这里是LSTM的概念一个非常好的解释,这里是一个包,它实现LSTM的R版本。


1

拥有面板数据时,您可以尝试解决其他任务,例如时间序列分类/回归或面板预测。对于每个任务,都有许多解决方法。

当您想使用机器学习方法来解决面板预测时,有多种方法:

关于输入数据(X),将单位(例如国家,个人等)作为iid样本,您可以

  • 将时间序列进行分箱并将每个分箱视为一个单独的列,忽略任何时间顺序,所有单元的分箱均相等,则分箱大小当然可以只是观察到的时间序列度量,或者您可以上采样并聚合为更大的分箱,然后使用标准的机器学习算法来处理表格数据,
  • 或从每个单位的时间序列中提取特征,然后将每个提取的特征用作单独的列,再结合标准表格算法,
  • 或根据观察的是连续时间还是分类时间数据,使用专门的时间序列回归/分类算法,这包括带有特殊内核的支持向量机,这些内核将时间序列与时间序列进行比较。

关于输出数据(y),如果您希望将来预测多个时间点,则可以

  • 始终使用相同的输入数据,为要预测的每一步拟合一个估算器,
  • 或在第一步中使用单个估计器进行预测,然后在预测中及时滚动输入数据,使用第一步预测将其追加到观察到的输入数据上,以进行第二步预测,依此类推。

以上所有方法基本上将面板预测问题简化为时间序列回归或表格回归问题。数据采用时间序列或表格回归格式后,您还可以为用户添加任何时不变特征。

当然,还有其他选项可以解决面板预测问题,例如使用经典的预测方法(例如适用于面板数据的ARIMA)或深度学习方法,这些方法可让您直接进行序列到序列的预测。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.