隐马尔可夫模型用于事件预测


9

问题在隐式马尔可夫模型的合理实现下进行设置吗?

我有一组108,000观察数据(在100天的时间内进行),并且2000在整个观察时间范围内大约都有事件发生。数据如下图所示,其中观察到的变量可以采用3个离散值,红色列突出显示事件时间,即:[1个23]ŤË

在此处输入图片说明

如图中红色矩形所示,我对每个事件都剖析了{到 },将它们有效地视为“事件前窗口”。ŤËŤË-5

HMM训练:我计划使用Pg上建议的多观察序列方法,基于所有“事前窗口” 训练隐马尔可夫模型(HMM)。Rabiner 论文 273 。希望这将使我能够训练HMM,以捕获导致事件的序列模式。

HMM预测:然后,我计划使用此HMM 预测 新一天的对,其中将是一个滑动窗口矢量,实时更新以包含当前时间至随着时间的推移。ØG[PØbsË[Rv一个Ť一世Øñs|H中号中号]ØbsË[Rv一个Ť一世ØñsŤŤ-5

对于与“事前窗口”类似的,我希望看到增加。实际上,这应该使我能够在事件发生之前进行预测。ØG[PØbsË[Rv一个Ť一世Øñs|H中号中号]ØbsË[Rv一个Ť一世Øñs


您可以拆分数据以构建模型(例如0.7),然后在其余数据上测试模型。只是一个想法,我不是这方面的专家。
费尔南多

是的,谢谢。HMM更适合我不确定的任务。
朱巴卜

@Zhubarb我正在处理类似的问题,并希望遵循您的HMM方法。您在哪里成功做到了?还是您最终重返了逻辑回归/ SVM等?
Javierfdr

@Javierfdr,由于实施困难以及女高音在他的回答中强调的担忧,我最终没有实施它。从本质上讲,HMM带有必须构建广泛的生成模型的负担,而我的直觉是针对当前的问题,您可以根据自己的建议更轻松地摆脱歧视性模型(SVM,神经网络等) 。
朱巴卜

Answers:


3

您所描述的方法的一个问题是,您将需要定义的增加幅度是有意义的,这可能很困难,因为通常总是很小。训练两个HMM可能更好,比如说HMM1用于发生关注事件的观察序列,而HMM2用于发生事件的观察序列。然后给定观察序列您具有 ,对于HMM2同样。然后,您可以预测如果 PØPØØ

PHH中号1个|Ø=PØ|H中号中号1个PH中号中号1个PØPØ|H中号中号1个PH中号中号1个
PH中号中号1个|Ø>PH中号中号2|ØPH中号中号1个PØ|H中号中号1个PØ>PH中号中号2PØ|H中号中号2PØPH中号中号1个PØ|H中号中号1个>PH中号中号2PØ|H中号中号2

免责声明:以下内容基于我个人的经验,因此请以实际情况为准。HMM的优点之一是,它们允许您处理可变长度的序列和可变顺序的效果(由于隐藏状态)。有时这是必要的(例如在许多NLP应用程序中)。但是,您似乎先验地假设只有最后5个观测值与预测感兴趣的事件有关。如果这个假设是现实的,那么使用传统技术(逻辑回归,朴素贝叶斯,SVM等),并且仅将最后5个观察值用作特征/独立变量,您可能会有更多的运气。通常,这些类型的模型将更易于训练,并且(以我的经验)会产生更好的结果。


@奥拓,谢谢。如您所说,我将查看,以及,因此发现显着增加可能是有问题的。同时,我认为训练HMM2将会很困难。我对HMM2的分数(没有事件)会高很多,可能没有p啪声,只有杂音。你怎么看? PS:我选择5作为我的窗口大小,它可能比实际实现中的更长。p=ØGPØ|Hp1个=-2504p2=-2403p3=-2450p
朱巴卜

1
@Berkan我不认为您提到的任何一个问题(没有事件序列多于事件序列,而没有事件只是噪音)应该排除2 HMM方法。如果您之前PH中号中号1个考虑到这一点(我已经在这方面更新了我的原始答案),那么您可能需要针对不平衡的类分布进行调整(没有事件多于事件),但是有很多方法可以解决这个问题。例如,请参见我给出的答案。
高音

@Berkan至于窗户的尺寸,根据我个人的经验,我希望我在此问题上所说的适用于任何固定的窗户尺寸。显然,我已经说过的所有内容都需要根据经验针对您的特定问题进行测试。
高音

感谢您更新答案,现在更加清晰了。由于我将使用对数,因此将进行比较:ØGPH中号中号1个+ØGPØ|H中号中号1个>ØGPH中号中号2+ØGPØ|H中号中号2。现在,ØGPH中号中号1个 是使用前向算法计算的,我该如何计算 ØGPH中号中号1个?ti只是我所任命的吗?
朱巴卜

感谢您更新答案,现在更加清晰了。由于我将使用对数,因此将进行比较:ØGPH中号中号1个+ØGPØ|H中号中号1个>ØGPH中号中号2+ØGPØ|H中号中号2。现在,ØGPH中号中号1个使用正向算法计算。我是否可以使用基于频率的简单MLE计算log(P(HMM1))?即对于给定的情况,H中号中号1个=52000/108000其中分子是属于HMM1的点数,而分母是数据集的大小。
朱巴卜
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.