假设我有一组解释变量,其中,,还有二进制结果相关变量的向量。因此,仅在最后时间观察到,而在任何更早的时间观察不到完全一般的情况下是有多个为为每个单元在每个时间,但让我们集中在壳体为简洁。 i = 1 。。。N t =1 。。。T Y i T Y T X i j t j = 1 ... K i t K = 1
具有时间相关的解释变量的“不平衡”对的应用例如(每日股票价格,季度股息),(每日天气报告,年度飓风)或(每次移动后的棋盘位置特征,赢/输结果)游戏结束)。
我对(可能非线性)回归系数做预测的,知道在训练数据中,给定的早期观察为它会导致最终结果 X 我吨吨< Ť ÿ 我Ť
从计量经济学的背景来看,我还没有看到很多应用于此类数据的回归建模。OTOH,我已经看到以下机器学习技术已应用于此类数据:
- 在整个数据集上进行监督学习,例如最小化
通过简单地将观察到的推断/推算到所有先前的时间点
感觉到“错误”,因为它没有考虑不同时间点之间的时间相关性。
- 使用学习参数和折扣参数进行强化学习(例如时差),并通过从开始的反向传播递归求解λ β 吨吨= Ť
使用相对于的的梯度。 ˚F ()β
这似乎更“正确”,因为它考虑了时间结构,但是参数和有点“特殊”。
问题:是否有文献将上述监督/强化学习技术映射到经典统计/计量经济学中使用的回归框架中?特别是,我希望能够通过做(非线性)最小二乘或最大似然估计“一次”(即同时对所有)估计参数在诸如吨= 1 ... Ť
我也很想了解时间差异学习元参数和是否可以从最大似然公式中恢复。λ