Answers:
神经网络不是魔术。如果您像对待它们一样对待他们,并且只是向他们扔数据而没有想到您会度过非常糟糕的时光。
您需要停下来问自己:“自1970年以来的毫秒数实际上可以预测我感兴趣的事件吗?” 您应该立即得到的答案是否定的。为什么?对于您实际上关心的每个实例(将来发生的事件,过去的事情已经发生),时间变量的值将大于时间变量在训练数据中所取的任何值。这样的变量不太可能有帮助。更糟糕的是,如果您不小心,可能会导致过度拟合(对于强大的非线性模型(如神经网络)来说是一个严重的问题)。
现在可能有意义的是一个变量,例如一年中的一周或一个月,可以帮助您模拟季节或年度影响。我在农业疾病预测方面做了一些工作,朱利安·戴维最终成为一个非常重要的变量。基于这种经验,我认为您最好将这种类型的变量编码为分类变量而不是序数,您的经验可能会更好。请注意,一年中的月份或一周是可重复的事件,您可能会在训练数据中多次看到该事件,并且可以解释为什么这样的变量会影响财务结果。将此与1970年以来的毫秒数进行对比,这只是一个单调增加的值。
最后,从您的陈述中说:“或者,只要我按时间顺序将其余数据馈入,是否就不需要时间?” 听起来您可能不太了解神经网络的工作原理。使用标准的前馈神经网络,将数据馈入网络的顺序不会对预测产生影响。如果您使用的是随机或小批量梯度下降,则订单可能会影响训练,但这只是迭代(而不是批处理)训练方法的人工产物。如果要使用神经网络对时间依赖性进行建模,则需要使用诸如滑动窗口或递归神经网络之类的方法。