2
滑动窗是否导致LSTM过度装配?
如果我通过滑动窗口方法训练LSTM,我会过拟合吗?为什么人们似乎并没有使用它LSTMs? 为了简化示例,假设我们必须预测字符序列: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 如果我继续用以下迷你批次训练LSTM是不好的(还是更好的?): A B C D E F G H I J K L M N, backprop, erase the cell B C D …