神经网络的编码日期/时间(循环数据)


12

如何为神经网络编码事件的日期和时间?

我没有连续的时间序列,但是有一些带有日期和时间的事件,并且我分析了一些兴趣。这种兴趣在早晨和晚上之间有所不同,在工作日之间,夏季和冬季之间以及圣诞节和复活节之前等等也有所不同。而且事件本身在时间上有很强的不均匀分布(白天多于晚上,一周中有更多种类,周末中有更多种类)。

我尝试将其编码为年中的“周数”,“工作日1-7”和“小时”。但是,使用稀疏的自动编码器给我的印象是,我的数据对神经网络没有任何意义,即使具有很大的隐藏层,它也无法在输入附近重现任何内容。既不是分类0-1,也不是归一化值。

但是,为神经网络搜索时间编码通常会提供有关时间序列的信息,因此我被森林蒙住了双眼,但却在寻找树。

当然,我可以查看数据并将其大致视情况归类。但是深度学习的概念似乎席卷了所有手工制作的手工特征提取。并且分类将在自然连续的输入变量中插入较大的跳跃。

我大脑中的“自然编码”更像是“夜”,“早晨”,“工作日”等某些类别的模糊成员。

为了使整个事情更有趣,dependend变量还包含那些日期/时间数据,但这是一个不同的问题。

编辑:与循环数据有关的某种方式是一些最近的问题,例如

使用该时段的数据集,哪些统计检验合理?

Answers:



1

您可以尝试将时间表示为一个大矩阵,即365 x 24,以表示一年中的日子和一天中的小时,然后将其“展开”为1 x 8760向量。时间将对应于该向量内的位置,并且该位置上的值就是当时的值。


2
您是否尝试过并成功使用类似的编码?如果神经网络以这种编码方式“学习”周日早晨的确切位置,我会感到惊讶。但是让天真惊讶的是神经网络的优势之一,所以我不敢打赌。;-)
flaschenpost

如果您想在不同年份的同一小时检测周期性事件,这可能会很有用,但是在我看来,相关性非常弱。对于大多数时间序列数据,我看到在每周的同一小时或每天的同一小时之间存在更高相关性的可能性。
thekingoftruth '16

1

我建议您使用已知(或相信)数据中已经存在的关系从时间序列创建多个输入要素。例如,您声明目标输出将有所不同:

在早上和晚上之间,以及在工作日之间以及夏季和冬季之间,...

因此,为什么不创建描述每个“周期”的功能集。这可能有助于弄清微观和宏观变化,而不是一个描述所有变化的功能。

例如...

如果您有趋势在每天的中午左右发生一些有趣的事情,请从创建一个特征来描述一天中的小时数。现在,网络将学习在12点左右触发。将此与将相同数据编码为一周小时的情况进行。现在,网络必须尝试学习在上触发,这要复杂得多。1..168 12 36 60 ...1..241..16812,36,60...


是的,这也是我的第一个想法。但是随后隐藏了时间的循环概念(23:59之后是00:00),令我困扰的另一件事是看似整数之间的跳跃-09:55发生的事件与10:05非常相似,但是早上06:10与06:55有很大的不同。我可以想象搜索时间的中心(光学之类的?),然后测量并给出到这些中心的距离。因此,上午04:30是最深的夜晚,而上午05:30则更“上午”,但完全不像晚上。
flaschenpost,2016年

1
好吧,在这种情况下,您可以尝试编码为正弦或余弦,或者实际上是两者。
CatsLoveJazz
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.